|
Dies der Anhang 1 zum Artikel Wie ist die Welt entstanden?, in dem ich erkläre, weshalb es überhaupt eine Welt gibt. Der folgende Text wird möglicherweise nur in diesem Zusammenhang verständlich.
Komplexe Zahlen als Elemente der Information
Philipp Wehrli, 2. Januar 2010
1. Weshalb komplexe Zahlen?
Die Aufgabe besteht darin, Information möglichst allgemein darzustellen. Ich zeige hier dass sich komplexe Zahlen gut als kleinste Elemente einer Informationstheorie eignen. Ich nenne diese Elemente `Aussagen´ oder `elementare Aussagen´. Sie sind uns aus der Quantentheorie als Amplituden bekannt, ich werde sie aber viel allgemeiner verwenden. In einem weiteren Schritt ergeben sich die Aussagenpaare, welche die Gruppe GL(2) bilden. Eine Untergruppe davon, die Qu-Bits, die eine SU(2) bilden, kennen wir als kleinste Informationseinheiten der Quantentheorie
1.1. Eine Sprache vor der Erschaffung der Welt
Der Begriff ‚Information’ wird in unserem ‚Informationszeitalter’ in sehr unterschiedlichen Bedeutungen gebraucht. Für eine vollständige Analyse wären auch die verschiedenen Aspekte dieses Begriffs zu berücksichtigen (z. B. die einzelnen Zeichen als Informationsträger, die Bedeutung der Zeichen und die Wirkung der Zeichen).
Ich muss aber glücklicherweise nicht all diese Aspekte aufrollen, da die meisten davon hier ohne Belang sind. Ich will nur eine abstrakte Sprache schaffen und darin 'keine Information' ausdrücken. Allerdings will ich diese Sprache a priori konstruieren. Sie darf also keine Begriffe enthalten, die ich nur aus der Erfahrung kenne. Und hierbei bin ich wesentlich vorsichtiger als Kant: Ich will nicht voraussetzen, dass a priori bekannt sei, was 'Zeit', was 'Raum' oder 'Kausalität' sei.
Ich stehe etwa vor der Aufgabe, ein Lexikon zu schaffen, ohne Bezug auf die Erfahrung zu nehmen. Die Definitionen in meinem Lexikon dürfen von anderen Definitionen im Lexikon abhängen. Jeder Begriff ist nur definiert durch seine Beziehung zu anderen Begriffen, nie durch seine Beziehung zur Realität (die ich ja a priori nicht kenne).
Blasphemisch gesprochen befinde ich mich in der Situation des Schöpfers vor der Erschaffung der Welt. Die Worte, die ich sage, können keinen Bezug zur Welt haben, weil es die Welt noch gar nicht gibt. Ich bin zu phantasielos, um eine Welt zu erfinden. Ich sage einfach zu jeder möglichen Aussage: "Keine Ahnung, ob das stimmt oder nicht!"
Immerhin raffe ich mich zu Aussagen auf wie: "Wenn x stimmt, dann ist y sicher falsch."Ausserdem will ich logische Widersprüche ausschliessen. Erst in einer späteren Phase werde ich die so konstruierten Beziehungsnetze mit Dingen aus der Realität identifizieren.
Als erstes erhebt sich die Frage: Was gibt es für Möglichkeiten, Informationen miteinander zu verknüpfen oder zu kombinieren, ohne dass Widersprüche entstehen?
Den kleinsten Bestandteil einer Information nenne ich 'Aussage'. Eine 'Aussage' wird sich als die Amplitude der Quantentheorie erweisen, sie wird also einfach durch eine komplexe Zahl ausgedrückt. Ich darf aber die Eigenschaften der 'Aussage' nicht aus der Beobachtung der Natur herleiten, sondern ich muss unabhängig von meinem Wissen über die Natur begründen, weshalb ich ausgerechnet die komplexen Zahlen als kleinste Einheit wähle und nicht etwas anderes.
Die Sprache, die ich nun konstruiere, wird wohl vielen völlig unzureichend und armselig erscheinen, um damit die Welt zu beschreiben. Ob sie zureichend ist, soll aber das Experiment zeigen. Wenn ich eine zu armselige Sprache verwende, werde ich eben nicht die ganze Reichhaltigkeit der Welt beschreiben können. Bei der Konstruktion der Sprache darf dies nicht meine Sorge sein. Im Gegenteil will ich die Sprache so armselig wie möglich gestalten und nur gerade die Eigenschaften fordern, die unumgänglich sind, um ein System mit null Information zu schaffen.
Ich versuche nun, ein Axiomensystem für Aussagen zu errichten. Wertvolle Anregungen dazu fand ich bei Finkelstein, der eine Art Axiomen System für Quantenobjekte schuf. Finkelstein betrachtete das Doppelspaltexperiment als Grundelement. Meine Addition entspricht bei ihm mehreren gleichzeitig möglichen Wegen, meine Multiplikation einer Hintereinanderausführung zweier Experimente. Meine Nullaussage entspricht einer völligen Absperrung sämtlicher Wege, das Einselement der Öffnung aller Wege.
Ich möchte hier aber genau umgekehrt vorgehen. Finkelstein geht von den anschaulichen Experimenten aus und leitet daraus eine Logik ab. Ich dagegen möchte von den Axiomen der Aussagen her die Physik ableiten. Deshalb ist mein Zugang viel abstrakter.
1.2. Welche Eigenschaften muss eine 'Aussage' sicher besitzen?
- Aussagen, die nur irgendwo gespeichert sind, aber nicht gelesen werden, sind uninteressant. Zu jeder Aussage gibt es eine Quelle und einen Empfänger, womit nicht unbedingt Lebewesen gemeint sind. Quelle und Empfänger können auch identisch sein. Entscheidend ist, dass eine Aussage den Empfänger verändert. Die erste Eigenschaft, die ich von einer Aussage fordere, ist, dass sie etwas verändert oder zumindest verändern könnte. Aussagen sind also Abbildungen. Obwohl ich hier von "Veränderungen" spreche, setze ich keine Zeit voraus. Abbildungen werden in der Mathematik als "eindeutige Korrespondenzen" definiert, was keinen Begriff der Zeit erfordert. Viel eher geht es um eine Hierarchie der Begriffe.
- Da ich die Sprache a priori konstruiere, gibt es nichts ausser Aussagen und Beziehungen zwischen Aussagen. Beziehungen zwischen Aussagen sind aber auch wieder Aussagen. Eine Aussage kann also nur eine andere Aussage verändern. Eine Aussage bildet die Menge der Aussagen auf sich selber ab, ähnlich wie ein Vektor mit dem Vektorprodukt die Menge der Vektoren im R3 auf sich selber abbildet. Diese Abbildung, bei der eine Aussage eine andere verändert, nenne ich Multiplikation.
- Eine oder mehrere Aussagen f1, f2, f3, ... können die gleiche Aussage g verändern. Es gibt also eine Verknüpfung, mit der zwei Aussagen f1 und f2 zu einer einzigen Aussage f verknüpft werden. Diese Verknüpfung nenne ich Addition und ich schreibe f1 + f2 = f.
- Die Addition und die Multiplikation von Aussagen folgen den Körperaxiomen. Sie haben die folgende Bedeutung:
i. Addition
Sei A die Menge der Aussagen und f, g A, dann gibt es eine Verknüpfung (Addition),
A x A à A
(f, g) à f + g
mit der Bedeutung: Zwei Aussagen f und g können zu einer einzigen Aussage f + g zusammengefasst werden. Die Veränderung, welche die zwei Aussagen f und g hervorrufen, ist gleich wie die Veränderung, welche durch f + g hervorgerufen wird.
ii. Multiplikation
Sei A die Menge der Aussagen und f, g aus A, dann gibt es eine Verknüpfung (Multiplikation),
A x A à A
(f, g) à f · g
mit der Bedeutung: Die Aussage g verändert eine Aussage x und die Aussage f verändert die durch g veränderte Aussage x, also g(x). Es gibt eine Aussage f · g = fg, welche auf alle x aus A die gleiche Wirkung hat, wie g und f hintereinander ausgeführt. (Es ist in der Mathematik üblich, die Operation g, die zuerst ausgeführt wird, rechts zu schreiben.)
Für die Addition gelten die Axiome
i.i.Assoziativgesetz: f + (g + h) = (f + g) + h für alle f, g, h aus A.
i.i. bedeutet: Die Veränderung, welche die drei Aussagen f, g und h hervorrufen, ist unabhängig davon, ob ich f und g in einer einzigen Aussage ausdrücke und diese neben h stelle oder ob ich g und h in einer einzigen Aussage ausdrücke und diese neben f stelle oder ob ich alle drei in einer einzigen Aussage ausdrücke.
i.ii. Kommutativgesetz: f + g = g + f für alle f, g aus A.
i.ii. bedeutet: Die Veränderung, welche die zwei Aussagen f und g an einer Aussage h hervorrufen, ist nicht davon abhängig, ob die Verknüpfung als f+g oder als f+g geschrieben wird.
i.iii. Existenz der Nullaussage: Es gibt eine Aussage 0 aus A, die immer hinzugefügt werden kann, ohne etwas zu verändern. Also
0 + f = f + 0 = f für alle f aus A.
Die Aussage 0 bildet jede Aussage auf die Nullaussage ab, also 0(x)à0. Denn
(f + 0)(x) = f(x) + 0(x) = f(x) für alle x aus A.
i.iv. Existenz des Negativen: Zu jeder Aussage f aus A existiert eine Aussage -f aus A mit
f + (-f) = 0
Das bedeutet: Zu jeder Aussage f kann eine Aussage -f hinzugefügt werden, welche die Aussage f völlig aufhebt.
i.iv. hat zur Folge, dass ich in der Gleichung
f + g = h
jede Aussage durch die zwei anderen ausdrücken kann. Nämlich
f = h + (-g) und g = h + (-f)
Für die Multiplikation gelten die folgenden Axiome:
ii.i. Assoziativgesetz: f(gh) = (fg)h für alle f, g, h aus A.
ii.i. bedeutet: Wenn die Aussagen h, g und f, die hintereinander auf ein Objekt wirken, spielt es keine Rolle, ob ich g und h zu einer Aussage gh verbinde und f auf diese Aussage wirken lasse oder ob ich f und b zu einer Aussage fg verknüpfe und diese auf h wirken lasse.
ii.ii. Kommutativgesetz: fg = gf für alle f, g aus A.
ii.ii. bedeutet: Die Reihenfolge, in der zwei Aussagen über ein Objekt ausgesprochen werden, spielt keine Rolle. Dies ist keineswegs so selbstverständlich, wie es auf den ersten Blick scheint. Denn anders als bei der Addition, wirken bei der Multiplikation die Aussagen nicht 'gleichzeitig' auf ein Objekt, sondern nacheinander. Bei fg wirkt f nicht auf das Objekt, sondern auf das durch g veränderte Objekt. Es ist nicht selbstverständlich, dass dabei das gleiche herauskommt, wie wenn g auf das durch f veränderte Objekt wirkt. Beim Begriff des 'Aussagenpaares', den ich später einführe, wird das Kommutativgesetz nicht mehr gelten. Man darf sich durchaus überlegen, ob es nötig ist, es hier einzuführen.
ii.iii. Existenz der Eins: Es gibt eine Aussage 1 aus A, die auf jede Aussage wirkt, ohne etwas zu verändern. Also:
1 · g = g · 1 = g für alle g aus A.
Die Aussage 1 bildet jede Aussage auf sich selber ab, also 1(x)àx.
ii.iv. Existenz des Inversen: Zu jeder von 0 verschiedenen Aussage g aus A gibt es eine Aussage
g-1 aus A mit gg-1 = 1
g-1 ist mehr als ein Widerrufen von g, denn es kann auch völlig losgelöst von g auftauchen. Ausserdem wird a durch g-1 wirklich völlig aufgehoben, was bei einem blossen Abstreiten im Alltag bekanntlich nicht der Fall ist. Das Inverse der Multiplikation bedeutet also, dass jede Veränderung auch wieder rückgängig gemacht werden kann.
Für die Verknüpfung von Addition und Multiplikation gilt das Distributivgesetz:
iii. f(g + h) = fg + fh für alle f, g, h aus A
Definition: Mengen mit zwei Verknüpfungen, welche den Axiomen i bis iii genügen, heissen Körper. Siehe z. B. (For 1).
Damit wir diesen Körper mit den komplexen Zahlen identifizieren können, müssen wir noch zwei Axiome hinzufügen: Es ist nötig, dass der obige Körper die Charakteristik 0 hat und dass er algebraisch abgeschlossen ist. Was dies bedeutet, erklären die folgenden zwei Definitionen.
Definition: Durch n-fache Addition des Einselementes eines Körpers K zum Nullelement ist eine Abbildung von den ganzen Zahlen auf den Körper K definiert:
j: Zà K, n à n · 1
Wenn n · 1 ungleich 0 für alle ganzen Zahlen ohne 0, dann sagt man, der Körper K habe die Charakteristik 0. (Siehe z. B. (Fis 1).
iv. Ich fordere also, dass die Menge der möglichen Aussagen die Charakteristik 0 hat. Das heisst, wenn eine Aussage ausser der 0 mehrmals (additiv) nebeneinander gestellt wird, so ergibt dies nie die Aussage 0. Eine mehrfache Aussage ist immer etwas anderes als keine Aussage.
Algebraische Abgeschlossenheit
Die Problemstellung hinter dem Begriff der algebraischen Abgeschlossenheit ist die folgende: Wenn ich nur mit natürlichen Zahlen N rechne, kann es passieren, dass ich auf die Rechnung
5 - 7 = x
stosse.
Diese Rechnung hat keine Lösung in den natürlichen Zahlen. Deshalb haben die Mathematiker die negativen Zahlen erfunden. Sie schreiben:
5 - 7 = (-2), weil 5 = 7 - 2
(-2) ist eine negative Zahl, eine völlig neue Erfindung, die in den natürlichen Zahlen nicht vorkommt. Die natürlichen Zahlen zusammen mit den negativen Zahlen und der 0 nennt man die Menge der ganzen Zahlen Z.
Beim Dividieren tritt ein ähnliches Problem auf bei der Rechnung:
5 : 3 = x
Offensichtlich ist x keine ganze Zahl. Wieder erfanden die Mathematiker neue Zahlen. Sie setzten
5 : 3 = 5/3
und nannten die neuen Zahlen die Brüche Q. Die ganzen Zahlen werden dann mit Brüchen mit dem Nenner 1 identifiziert. Also z. B.:
5 5/1
Eine dritte Erweiterung der Zahlenmenge wird nötig, wenn wir Wurzeln ziehen wollen. Die Wurzel von 2, also 21/2 ist kein Bruch. Ebenso können gewisse Reihen nicht als Bruch geschrieben werden, z. B. die Kreiszahl p. Richard Dedekind zeigte, wie wir auch mit diesen Objekten widerspruchsfrei rechnen können. Wir nennen sie die reellen Zahlen R.
Ein viertes Mal ergibt sich das Problem, wenn man von einer negativen Zahl die Wurzel zieht, z. B.:
(-1)1/2 = x
Es müsste also gelten x · x = (-1)
Wenn aber x positiv ist, ergibt x · x eine positive Zahl. Wenn x negativ ist, ist x · x ebenfalls positiv. x · x wird sicher nicht negativ, wenn x ein Bruch ist. Die Mathematiker möchten aber auch für diese Rechnung eine Lösung haben, also eine Zahl, die sie für x einsetzen können, so dass die Gleichung stimmt. Also erfanden sie diese Lösung einfach, genau wie sie es bei den negativen Zahlen und bei den Brüchen gemacht haben. Es ist praktisch, wenn man die Lösung von solchen Gleichungen benennen kann. Deshalb nennen die Mathematiker die Lösung der obigen Gleichung i, also:
(-1)1/2 = i
i ist eine komplexe Zahl, und es gibt noch andere davon, die die Lösungen von anderen Gleichungen sind. Die Menge der komplexen Zahlen C enthält die Menge der Brüche, wie die Menge der Brüche die ganzen Zahlen enthält. Sie enthält darüber hinaus aber die Lösungen aller denkbaren algebraischen Gleichungen, die mit Brüchen aufgestellt werden können. Eine komplexe Zahl c setzt sich zusammen aus einem Betrag c und einer Phase eij.
i ist das obige i = (-1)1/2.
Oft werden komplexe Zahlen in einen Real- und einen Imaginärteil zerlegt. Diese Darstellung eignet sich für die folgenden Überlegungen aber nicht.
Bei der Addition und bei der Multiplikation von zwei komplexen Zahlen ergeben sich wieder komplexe Zahlen. Dies ist allgemein so: Bei Additionen, Subtraktionen, Multiplikationen, Divisionen, Potenzen oder Wurzeln, in denen nur komplexe Zahlen vorkommen, erhalte ich wieder komplexe Zahlen. Dies ist unter 'algebraischer Abgeschlossenheit' zu verstehen: Ich kann mit den Elementen eines algebraisch abgeschlossenen Körpers alle die obigen Operationen durchführen, wie ich will, und ich falle dabei sicher nicht aus dem Körper heraus. Der Körper der komplexen Zahlen ist algebraisch abgeschlossen, der Körper der Brüche nicht (Fis 1).
Ich fordere also, dass die Menge der Aussagen algebraisch abgeschlossen ist. Das bedeutet z. B., dass es zu jeder Aussage x auch eine Aussage x1/2 gibt, mit
x1/2 · x1/2 = x
Die einfachste Menge, die die obigen Bedingungen erfüllt, ist die Menge der komplexen Zahlen. Dies könnte etwa als Begründung angefügt werden, weshalb die komplexen Zahlen als Elemente einer Informationstheorie geeigneter sind als z. B. die reellen. Natürlich sind die obigen Bedingungen alles andere als zwingend. Es ist wohl durchaus möglich, eine Sprache aus Elementen mit anderen Eigenschaften aufzubauen. Ich vermute, in so einer anderen Sprache würde meine weitere Schlussfolgerung etwas umständlicher, sie wäre aber im Kern unverändert.
Was ist der Inhalt der Aussagen?
Wenn in meiner Sprache die obigen Axiome gelten sollen, dann verhalten sich die elementaren Aussagen dieser Sprache wie komplexe Zahlen. Bis jetzt haben diese Aussagen aber noch keinen Inhalt. Muss ich irgendwelche realen Dinge einführen, die in diesen Aussagen vorkommen und den Aussagen einen Inhalt verleihen?
Genau das will ich vermeiden! Ich hoffe zwar, dass mein System von Aussagen am Ende die realen Dinge nachbildet. Aber ich darf den realen Dingen nicht vorschreiben, wie sie zu sein haben. Ich will also in dieser elementaren Sprache keine Begriffe wie 'Atom', 'Energie' oder 'Raum' definieren. Denn diese Begriffe können wir in unserer Alltagssprache nur benützen, weil wir sie aus unserer Erfahrung kennen. Ich werde mein System von Aussagen ohne Bezug auf die reale Welt aufbauen. Das System ist ein Lexikon, das nur Bezug nimmt auf Definitionen aus diesem Lexikon, aber nicht auf eine Realität ausserhalb. Insofern ist das Lexikon dem Universum nachgebildet, denn auch das Universum enthält ja die gesamte Information in sich.
Man beachte, dass ich bis hierhin keine Aussage über die Welt gemacht habe. Ich habe nur festgelegt, in welcher Sprache ich über die Welt schreiben will. Vielleicht wird sich herausstellen, dass diese Sprache nicht ausreicht, die Welt zu beschreiben.
Weil es in der Sprache nur Aussagen und Beziehungen zwischen Aussagen gibt, können sich die Aussagen auch immer nur auf andere Aussagen oder auf Beziehungen zwischen anderen Aussagen beziehen. Es geht also zunächst nicht so sehr um den Inhalt der Aussagen, als vielmehr um das Beziehungsnetz, das zwischen Aussagen überhaupt bestehen kann.
Zurück zum Haupttext
|