Die Pauli-Matrizen $ \sigma _{1},\sigma _{2},\sigma _{3} $ (nach Wolfgang Pauli) sind spezielle komplexe hermitesche 2×2-Matrizen. Zusammen mit der 2×2-Einheitsmatrix, die in diesem Zusammenhang mit $ \sigma _{0} $ bezeichnet wird, bilden sie sowohl eine Basis des 4-dimensionalen reellen Vektorraums aller komplexen hermiteschen 2×2-Matrizen als auch eine Basis des 4-dimensionalen komplexen Vektorraums aller komplexen 2×2-Matrizen.
Sie wurden von Wolfgang Pauli 1927 zur Beschreibung des Spins eingeführt,[1] waren in der Mathematik aber auch schon vorher bekannt.
Die Pauli-Matrizen lauten ursprünglich:
Hierbei bezeichnet $ \mathrm {i} $ die imaginäre Einheit. Die Matrizen wurden ursprünglich in der Quantenmechanik eingeführt, um die grundlegenden Kommutationsregeln der Komponenten des Spin-Operators zu erfüllen (siehe unten). Häufig wird, besonders in der relativistischen Quantenmechanik, noch die Einheitsmatrix als nullte Paulimatrix dazugenommen:
Für die Multiplikation einer Pauli-Matrix mit einer anderen Pauli-Matrix ergibt sich aus den Rechenregeln der Matrixmultiplikation folgende Tafel:
$ \cdot $ | $ \sigma _{0} $ | $ \sigma _{1} $ | $ \sigma _{2} $ | $ \sigma _{3} $ |
---|---|---|---|---|
$ \sigma _{0} $ | $ \sigma _{0} $ | $ \sigma _{1} $ | $ \sigma _{2} $ | $ \sigma _{3} $ |
$ \sigma _{1} $ | $ \sigma _{1} $ | $ \sigma _{0} $ | $ \mathrm {i} \,\sigma _{3} $ | $ -\mathrm {i} \,\sigma _{2} $ |
$ \sigma _{2} $ | $ \sigma _{2} $ | $ -\mathrm {i} \,\sigma _{3} $ | $ \sigma _{0} $ | $ \mathrm {i} \,\sigma _{1} $ |
$ \sigma _{3} $ | $ \sigma _{3} $ | $ \mathrm {i} \,\sigma _{2} $ | $ -\mathrm {i} \,\sigma _{1} $ | $ \sigma _{0} $ |
Das Produkt $ \sigma _{i}\cdot \sigma _{j} $ befindet sich in der mit $ \sigma _{i} $ gekennzeichneten Zeile und der mit $ \sigma _{j} $ gekennzeichneten Spalte. Das Beispiel $ \sigma _{2}\cdot \sigma _{1}=-\mathrm {i} \,\sigma _{3} $ zeigt, dass die Pauli-Matrizen mit der Matrixmultiplikation als Verknüpfung keine Gruppe bilden.
Die von ihnen erzeugte Gruppe hat den Namen $ G_{16}^{10} $.[2] Sie enthält das Element $ \sigma _{1}\cdot \sigma _{2}\cdot \sigma _{3}=\mathrm {i} \,\sigma _{0}=\left({\begin{smallmatrix}\mathrm {i} &0\\0&\mathrm {i} \end{smallmatrix}}\right) $, welches im Zentrum liegt, also mit allen Elementen kommutiert. Die Gruppe $ G_{16}^{10} $ besteht somit aus den 16 Elementen $ \mathrm {i} ^{j}\,\sigma _{k}\;\;(j,k=0,1,2,3). $ Sie enthält die Quaternionengruppe Q8 als Normalteiler (siehe Die Quaternionen als Unterring von C4 und Liste kleiner Gruppen), woraus sich $ G_{16}^{10}\cong Q_{8}\rtimes \{\sigma _{0},\sigma _{1}\} $ ergibt. Der Zykel-Graph ist .[3]
Gegeben sei eine komplexe 2×2-Matrix $ \mathbf {A} $ mit den Elementen $ \left\{a_{ij}\ |\ i,j\in \left\{0,1\right\},a_{ij}\in \mathbb {C} \right\} $. Dann lassen sich komplexe Zahlen $ \left\{z_{i}\ |\ i\in \left\{0,1,2,3\right\},z_{i}\in \mathbb {C} \right\} $ finden, für die gilt:
$ \mathbf {A} $ | $ ={\begin{pmatrix}a_{00}&a_{01}\\a_{10}&a_{11}\end{pmatrix}}={\begin{pmatrix}z_{0}+z_{3}&z_{1}-\mathrm {i} \,z_{2}\\z_{1}+\mathrm {i} \,z_{2}&z_{0}-z_{3}\\\end{pmatrix}} $ | |||
$ =z_{0}\,{\begin{pmatrix}1&0\\0&1\end{pmatrix}} $ | $ +\,z_{1}\,{\begin{pmatrix}0&1\\1&0\end{pmatrix}} $ | $ +\,z_{2}\,{\begin{pmatrix}0&-\mathrm {i} \\\mathrm {i} &0\end{pmatrix}} $ | $ +\,z_{3}\,{\begin{pmatrix}1&0\\0&-1\end{pmatrix}} $ | |
$ =z_{0}\;\;\sigma _{0} $ | $ +\,z_{1}\;\;\sigma _{1} $ | $ +\,z_{2}\;\;\sigma _{2} $ | $ +\,z_{3}\;\;\sigma _{3}\;. $ |
Es gelten die Umrechnungen:
bzw.:
Eine komplexe 2×2-Matrix kann demnach als Linearkombination der $ \sigma _{i} $ geschrieben werden, und diese Darstellung ist eindeutig. Die Pauli-Matrizen bilden also eine Basis des $ \mathbb {C} $-Vektorraums (und Matrizenrings) $ \mathbb {C} ^{2\times 2} $, und diese Basis ist eine orthogonale unter dem Frobenius-Skalarprodukt.
Die Umrechnungen definieren einen Ringisomorphismus
mit der üblichen Vektoraddition, der üblichen $ \mathbb {C} $-Skalarmultiplikation und der Vektor-Multiplikation
$ (x_{0},x_{1},x_{2},x_{3})\star (y_{0},y_{1},y_{2},y_{3}):=( $ | $ x_{0}y_{0}+\,x_{1}y_{1}+\,x_{2}y_{2}+\,x_{3}y_{3}, $ |
$ x_{0}y_{1}+\,x_{1}y_{0}+\mathrm {i} x_{2}y_{3}-\mathrm {i} x_{3}y_{2}, $ | |
$ x_{0}y_{2}-\mathrm {i} x_{1}y_{3}+\,x_{2}y_{0}+\mathrm {i} x_{3}y_{1}, $ | |
$ x_{0}y_{3}+\mathrm {i} x_{1}y_{2}-\mathrm {i} x_{2}y_{1}+\,x_{3}y_{0}\,) $ |
in $ \mathbb {C} ^{4}. $ Zwei Vektoren sind genau dann miteinander vertauschbar, wenn
wenn also die Vektorteile $ (x_{1},x_{2},x_{3}) $ und $ (y_{1},y_{2},y_{3}) $ $ \mathbb {C} $-linear voneinander abhängen.
Die inverse Matrix von $ \mathbf {A} =z_{0}\,\sigma _{0}+z_{1}\,\sigma _{1}+z_{2}\,\sigma _{2}+z_{3}\,\sigma _{3} $ berechnet sich im Fall von $ z_{0}^{2}-z_{1}^{2}-z_{2}^{2}-z_{3}^{2}\neq 0 $ hieraus zu
Die Teilmenge der hermiteschen 2×2-Matrizen, also der Matrizen $ \mathbf {A} $ mit
ist ein $ \mathbb {R} $-Untervektorraum, für den die Pauli-Matrizen ebenfalls eine Basis bilden, die Koeffizienten $ z_{i} $ sind aber reell. Anders gesagt: es gibt bei hermiteschen 2×2-Matrizen vier (reelle) freie Parameter, da $ a_{00} $ und $ a_{11} $ reell sind und $ a_{01}={\overline {a_{10}}} $.
Das Produkt zweier hermitescher Matrizen ist hermitesch, wenn sie kommutieren. Der Untervektorraum ist also kein (Unter)ring.
(Unter)ring ist aber ein anderer Untervektorraum von $ \mathbb {C} ^{4} $, der sich durch Koeffizienten $ z_{0}\in \mathbb {R} , $ $ z_{1}\in \mathrm {i} \mathbb {R} , $ $ z_{2}\in \mathrm {i} \mathbb {R} , $ $ z_{3}\in \mathrm {i} \mathbb {R} $ von $ (\sigma _{0},\sigma _{1},\sigma _{2},\sigma _{3}) $ aufspannen lässt. Er ist ebenfalls mit der $ \mathbb {R} $-Skalarmultiplikation verträglich und zusätzlich hinsichtlich der Multiplikation $ \star $ abgeschlossen. Dieser $ \mathbb {R} $-Untervektorraum ist isomorph zu den Quaternionen $ \mathbb {H} $.
Als Basis für reelle Koeffizienten kann man die mit der imaginären Einheit multiplizierten Pauli-Matrizen zusammen mit der Einheitsmatrix nehmen, also die Menge $ \{\sigma _{0},\mathrm {i} \sigma _{1},\mathrm {i} \sigma _{2},\mathrm {i} \sigma _{3}\} $, mit der isomorphen Zuordnung:
mit $ i_{\mathbb {H} },j_{\mathbb {H} },k_{\mathbb {H} } $ als den bekannten Einheitsquaternionen. Vor diese Zuordnung lässt sich jeder der 24 Automorphismen der Quaternionengruppe Q8 schalten. So kann auch ein Isomorphismus „in umgekehrter Ordnung“ gebaut werden:[4]
In der Quantenphysik, in der den physikalischen Observablen auf mathematischer Seite hermitesche Operatoren bzw. Matrizen entsprechen, wird der Drehimpulsoperator $ {\hat {S}}_{i},\ i\in \{1,2,3\} $ von Spin-½-Zuständen, beispielsweise bei Elektronen, durch die Paulimatrizen dargestellt:
wobei $ \doteq $ „wird dargestellt durch“ bedeutet.
In der relativistischen Quantenmechanik, wo man entsprechend dem relativistischen Vierervektor Formalismus vier Raum-Zeit bzw. Energie-Impuls Variablen hat, tritt die Einheitsmatrix gleichberechtigt zu den drei Pauli-Matrizen (als „nullte“ Pauli-Matrix) und es wird mit ihrer Hilfe die Dirac-Gleichung mit den Dirac-Matrizen aufgebaut.
Direkt tauchen die Pauli-Matrizen in der Pauli-Gleichung zur quantenmechanischen Beschreibung von Teilchen mit Spin im Magnetfeld auf, die sich aus der nichtrelativistischen Reduktion der Diracgleichung ergibt, und in der Beschreibung von Majorana-Fermionen (Majorana-Gleichung).
Die Pauli-Matrizen können neben der Darstellung als Matrizen mit Hilfe der Dirac-Notation dargestellt werden: Dabei können für die Linearkombination entweder die Standard-Basisvektoren oder die Eigenvektoren der Pauli-Matrizen verwendet werden.
Pauli-Matrix | Matrix | Linearkombination (Standard-Basisvektoren) | Linearkombination (Eigenvektoren) |
---|---|---|---|
$ \sigma _{1}=\sigma _{x} $ | $ {\begin{pmatrix}0&1\\1&0\end{pmatrix}} $ | $ |0\rangle \langle 1|+|1\rangle \langle 0| $ | $ |+\rangle \langle +|\,-\,|-\rangle \langle -| $ |
$ \sigma _{2}=\sigma _{y} $ | $ {\begin{pmatrix}0&-\mathrm {i} \\\mathrm {i} &0\end{pmatrix}} $ | $ \mathrm {i} \left(|1\rangle \langle 0|-|0\rangle \langle 1|\right) $ | $ |\phi ^{+}\rangle \langle \phi ^{+}|-|\phi ^{-}\rangle \langle \phi ^{-}| $ |
$ \sigma _{3}=\sigma _{z} $ | $ {\begin{pmatrix}1&0\\0&-1\end{pmatrix}} $ | $ |0\rangle \langle 0|-|1\rangle \langle 1| $ | $ |0\rangle \langle 0|-|1\rangle \langle 1| $ |
Die verwendeten Vektoren sind wie folgt definiert, wobei die verwendeten Kets durch Vektoren des $ \mathbb {C} ^{2} $ dargestellt werden, was durch „$ \doteq $“ gekennzeichnet ist:
$ |0\rangle =|s_{z}+\rangle $ | $ \doteq {\begin{pmatrix}1\\0\end{pmatrix}} $ | $ |1\rangle =|s_{z}-\rangle $ | $ \doteq {\begin{pmatrix}0\\1\end{pmatrix}} $ |
$ |+\rangle $ | $ \doteq {\frac {1}{\sqrt {2}}}{\begin{pmatrix}1\\1\end{pmatrix}} $ | $ |-\rangle $ | $ \doteq {\frac {1}{\sqrt {2}}}{\begin{pmatrix}1\\-1\end{pmatrix}} $ |
$ |\phi ^{+}\rangle $ | $ \doteq {\frac {1}{\sqrt {2}}}{\begin{pmatrix}1\\\mathrm {i} \end{pmatrix}} $ | $ |\phi ^{-}\rangle $ | $ \doteq {\frac {1}{\sqrt {2}}}{\begin{pmatrix}1\\-\mathrm {i} \end{pmatrix}}. $ |
Die Pauli-Matrizen sind hermitesch und unitär. Daraus folgt mit dem durch $ \sigma _{0}:={\begin{pmatrix}1&0\\0&1\end{pmatrix}} $ definierten vierten Basiselement
Die Determinanten und Spuren der Pauli-Matrizen sind
Aus Obigem folgt, dass jede Pauli-Matrix $ \mathbf {\sigma } _{i} $ die Eigenwerte +1 und −1 besitzt.
Des Weiteren:
Die Pauli-Matrizen erfüllen die algebraische Relation
($ \epsilon _{ijk} $ ist das Levi-Civita-Symbol), also insbesondere bis auf einen Faktor 2 dieselben Relationen wie die Drehimpulsalgebra
und die Clifford- oder Dirac-Algebra $ \mathrm {Cl} (0,3,\mathbb {R} ) $
Die Pauli-Matrizen gehören zum Spezialfall $ l=1/2 $ von Drehimpulsoperatoren, die auf Basisvektoren $ \Lambda _{m} $ eines Drehimpuls-$ l $-Multipletts mit Quantenzahlen $ m $ in Maßsystemen mit $ \hbar =1 $ folgendermaßen wirken:
Dabei ist $ 2l+1 $ eine natürliche Zahl und für $ m $ treten die $ 2l+1 $ verschiedenen Quantenzahlen $ m=-l,-l+1,\dots ,l $ auf. Für $ l=1/2 $ wirken die Drehimpulsoperatoren auf die Komponenten von Linearkombinationen der beiden Basisvektoren $ \Lambda _{1/2} $ und $ \Lambda _{-1/2} $ demnach durch Multiplikation mit den folgenden Matrizen
Mit $ L_{1}={\frac {1}{2}}(L_{+}+L_{-}) $ und $ L_{2}={\frac {1}{2\mathrm {i} }}(L_{+}-L_{-}) $ ergibt sich dann, dass die Drehimpulsoperatoren auf die Komponenten von Spin-1/2-Zuständen durch Multiplikation mit den halben Pauli-Matrizen wirken.
Die lineare Hülle der mit $ \mathrm {i} $ multiplizierten[5] Pauli-Matrizen $ \mathrm {i} \,\sigma _{1},\,\mathrm {i} \,\sigma _{2},\,\mathrm {i} \,\sigma _{3} $ ist mit der üblichen Matrizenmultiplikation eine Lie-Algebra. Aufgrund der mit $ {\vec {n}}\cdot {\vec {\sigma }}\,=n_{1}\sigma _{1}+n_{2}\sigma _{2}+n_{3}\sigma _{3} $ für jeden Einheitsvektor $ {\vec {n}}\in \mathbb {R} ^{3} $ geltenden Identität[6]
sind diese drei Matrizen die Generatoren der komplexen Drehgruppe $ SU(2) $.
Der Faktor 1/2 in der obigen Gleichung ist zwar mathematisch verzichtbar. Die Gleichung wird jedoch in der physikalischen Anwendung häufig in genau dieser Form benötigt. Denn (wie in der Einleitung erwähnt) stellen in der Quantenphysik die Matrizen $ S_{i}={\tfrac {\hbar }{2}}\sigma _{i} $ die Operatoren für die Spinkomponenten eines Spin-1/2-Systems (beispielsweise eines Elektrons) dar. Andererseits beschreibt die durch den Exponentialausdruck gegebene Matrix die Veränderung des Spinzustands bei einer räumlichen Drehung. $ \alpha $ ist dabei der Drehwinkel, $ {\vec {n}} $ die Drehachse. Für $ \alpha =2\pi $ ergibt sich $ \exp {\bigl (}\!\!-\mathrm {i} \,\pi \;{\vec {n}}\cdot {\vec {\sigma }}{\bigr )}=-\sigma _{0} $; d. h. der Zustandsvektor eines Spin-1/2-Systems wird durch Drehung um den Winkel $ 2\pi $ in sein Negatives und erst durch Drehung um den Winkel $ 4\pi $ wieder in sich selbst übergeführt („Spinordrehungen“).
Die Matrix $ \sigma _{3} $ hat die Eigenvektoren
wie man leicht erkennen kann:
entsprechend den Eigenwerten $ \pm 1 $. Die Eigenvektoren von $ \sigma _{1} $ sind
und die Eigenvektoren von $ \sigma _{2} $
In der Mathematik können mit Hilfe des Tensorprodukts (Kronecker-Produkts) von Pauli-Matrizen (mit Einheitsmatrix) die Darstellungen der höheren Clifford-Algebren über den reellen Zahlen aufgebaut werden.
Pauli-Matrizen können zur Darstellung von Hamilton-Operatoren und zur Näherung der Exponentialfunktion solcher Operatoren verwendet werden. Sind $ \sigma _{0},\sigma _{1},\sigma _{2},\sigma _{3} $ die vier Pauli-Matrizen, so kann man mit Hilfe des Kronecker-Produkt höherdimensionale Matrizen erzeugen.
Eigenschaften der Pauli-Matrizen vererben sich auf diese Matrizen. Sind $ p_{1} $ und $ p_{2} $ zwei Kronecker Produkte von Pauli-Matrizen, so gilt:
Beispiele für derartige Modelle sind Hubbard-Modell, Heisenberg-Modell und Anderson-Modell.
Das Kronecker-Produkt von Pauli-Matrizen tritt bei der Beschreibung von Spin-1/2-Systemen auf, die aus mehreren Teilsystemen aufgebaut sind. Der Zusammenhang ist dadurch gegeben, dass das Tensorprodukt zweier Operatoren in der zugehörigen Matrixdarstellung gerade durch das Kronecker-Produkt der Matrizen gegeben ist (siehe Kronecker-Produkt#Zusammenhang mit Tensorprodukten).
Häufig interessiert man sich für die Exponentialfunktion des Hamilton-Operators.
Aufgrund der Kommutativität kann man in einem Produkt die Matrizen beliebig anordnen. Ist $ \pi $ eine Permutation, so ist:
Deshalb existieren rationale Zahlen $ E_{k_{1}k_{2}...k_{N}} $ mit:
Diese rationalen Zahlen sind, von Ausnahmen abgesehen, schwer zu berechnen.
Eine erste Näherung ergibt sich, indem man nur Summanden berücksichtigt, die aus kommutierenden Matrizen bestehen.
Die Näherung lässt sich weiter verbessern, indem man Paare, Tripel, … von nicht kommutierenden Matrizen berücksichtigt.