Dirac方程式（導入篇）

1 概要
2 解説
3 参考文献

概要

非相対論的量子力学を記述するSchrödinger方程式が一定の成功を収めた後、相対論的な範囲に拡張する試みが行われました。1928年、量子力学と特殊相対論を融合した理論として、Dirac方程式 $$ (i\gamma^\mu\partial_\mu-m)\psi(x)=0 $$ が発表されました。

Dirac方程式はスピン自由度と共に、当時は未発見だった反粒子の存在を含みます。
電子やクォークのようにスピン1/2を持つ粒子を記述する基礎方程式として、その後の量子電磁力学（QED）や標準模型への発展へと繋がることになります。

Diracの原論文による導入は非常にエレガントなものであり、そのインパクトの大きさと相まって、個人的には数多くある物理学の公式の中で最も美しいと思っています。
どのような考察でDirac方程式に至るのかを、Klein-Gordon方程式・ガンマ行列にも言及しながら、数式を使って説明していきます。

本記事では自然単位系（$\hbar=c=1$）を採用し、Minkowski計量は $\eta^{\mu\nu}=\mathrm{diag}[1,-1,-1,-1]$ を用います。
ラテン文字の添字は空間座標、ギリシャ文字の添字は時空の座標を表し、重複する添字は和を取ります（Einsteinの縮約）。

ガンマ行列に関する美しい計算の数々は、こちらの記事で詳しく解説しています：

ガンマ行列

概要(1+3)次元時空の相対論的量子力学において、電子やクォークのようにスピン1/2を持つ自由粒子は、Dirac方程式 $$ (i\gamma^\mu\partial_\mu-m)\psi(x)=0 $$ によって記述されます。この中に登場...

解説

Schrödinger方程式の拡張

Schrödinger方程式は $$ i\pdv{t}\psi(x) = \hat{H}\psi(x) $$ で与えられます。引数 $x$ は $(t,\bm{x})$ をまとめて書いたものです。
非相対論的な自由粒子の場合、ハミルトニアンは古典力学の運動エネルギー $\hat{H}=\frac{\hat{\bm{p}}^2}{2m}$ を座標表示することで、波動関数に対する微分方程式となります。すなわち、$\hat{\bm{p}}\mapsto -i\nabla$ と置き換えて $$ i\pdv{t}\psi(x) = -\frac{1}{2m}\triangle\psi(x) $$ が得られます。

Schrödinger方程式を、特殊相対論の範囲に拡張することを試みます。相対論的な自由粒子のエネルギーは $\hat{H}=\sqrt{\hat{\bm{p}}^2+m^2}$ なので、素朴にSchrödinger方程式に代入すると $$ i\pdv{t}\psi(x) = \sqrt{-\triangle+m^2}\psi(x) $$ となってしまい、見るからに扱いにくい形です。
平方根を外すために、$\hat{H}^2=\hat{\bm{p}}^2+m^2$ に注目して $\hat{H}\mapsto i\partial_t,$ $\hat{\bm{p}}\mapsto -i\nabla$ の置き換えを施すと $$ -\pdv[2]{t}\psi(x) = (-\triangle+m^2)\psi(x)$$ $$ \begin{equation} \therefore\quad (\square+m^2)\psi(x) = (\partial_t^2-\triangle+m^2)\psi(x)=0 \label{eq:KGeq} \end{equation} $$ となります。これはKlein-Goldon方程式と呼ばれるものです。
$\square=\partial_\mu\partial^\mu$ はダランベルシアンです。

Klein-Goldon方程式はLorentz変換で不変であり、相対論的に正しい方程式です。場の量子論の枠組みでは、第二量子化してスピン0のボソンを記述する基礎方程式として用いられます。
しかしながら、Dirac方程式が発表された当時は、第二量子化はまだ確立されていませんでした。第一量子化の文脈で、Schrödinger方程式と同じように $\psi(x)$ を波動関数として解釈しようとすると困難が生じます。

問題点

Klein-Goldon方程式の解を波動関数として用いた場合に起こる問題点には、

スピン二重項を第一原理から導出できないこと
確率密度が負になり波動関数の確率解釈ができないこと

が挙げられます。それぞれ詳しく見ていきましょう。

スピン二重項

主たる研究対象であった電子は、スピン1/2の内部自由度を持っています。つまり、座標 $\bm{x}$ および運動量 $\bm{p}$ に加えてスピン角運動量 $\bm{m}$ を指定することで、各時刻の電子の状態が定まります。
スピンの存在は物理的な観測結果を変化させます。例えば、スピンと外部磁場の相互作用は、Zeeman効果のスペクトル分裂として知られていました。

これを従来の量子力学の枠組みで扱う場合、電磁場中のSchrödinger方程式にスピン磁気相互作用項を付け足したPauli方程式（1927年）を適用することができます。 $$ \begin{equation} i\pdv{t}\pmatrix{\psi_\uparrow(x) \\ \psi_\downarrow(x) } = \left[ \frac{1}{2m}\left( -i\nabla-q\bm{A} \right)^2-\frac{q}{2m}\bm{\sigma}\cdot\bm{B} +q\phi \right]\pmatrix{\psi_\uparrow(x) \\ \psi_\downarrow(x) } \label{eq:Paulieq} \end{equation} $$ ここで、$q\,(<0)$ は電子の電荷、$\bm{\sigma}=(\sigma^1,\sigma^2,\sigma^3)$ はPauli行列で2×2行列です。

Pauli方程式は実験結果を上手に説明できてはいたものの、スピン上向き成分と下向き成分の独立な式をPauli行列で繋ぎ合わせたような形をしています。これをDiracは、人為的な仮定を置いており自然法則を表す式として不完全だと感じていたことが、論文に記載されています。
また、現代の立場から見ると、Pauli方程式はDirac方程式について非相対論極限をとったものであり、近似的な理論だと言えます。それゆえに、スピン軌道相互作用 (※) のような現象を説明することはできません。

Klein-Goldon方程式もまたスピンを記述する要素は含まれておらず、スピン相互作用を記述したければPauli方程式のように相互作用項を人の手で付け加える必要があります。

(※) 魔法数で有名な原子核の殻模型で用いられるスピン軌道相互作用は、電磁気力ではなく核力に由来することに注意。

負の確率密度

Klein-Gordon方程式\eqref{eq:KGeq}は質量項を含んだ波動方程式であり、解の一般形は平面波になります。 $$ \begin{equation} \psi(x) = N\em^{-i(Et-\bm{p}\cdot\bm{x})} \;,\;\; E=\pm E_\bm{p}=\pm\sqrt{\bm{p}^2+m^2} \label{eq:KG_plainwave} \end{equation} $$ 解であることは、以下のように確認されます。 $$ \begin{align*} (\square+m^2)\psi(x) &= (\partial_t^2-\triangle+m^2)N\em^{-i(\pm E_\bm{p}t-\bm{p}\cdot\bm{x})} \\ &= \Bigl[ (\mp iE_\bm{p})^2 -(i\bm{p})^2 +m^2 \Bigr]N\em^{-i(\pm E_\bm{p}t-\bm{p}\cdot\bm{x})} \\ &= [-(\bm{p}^2+m^2) +\bm{p}^2 +m^2]\psi(x) \\ &= 0 \end{align*} $$

Klein-Gordon方程式についてもSchrödinger方程式の場合と同様に、保存則 $\partial_\mu j^\mu=0$ を満たす確率流密度 $j^\mu(x)$ を構成することができます。

問1

Klein-Gordon方程式\eqref{eq:KGeq}に従う粒子の確率流密度は $$ \begin{equation} j^\mu=i\{ \psi^\ast(\partial^\mu\psi)-(\partial^\mu\psi^\ast)\psi \} \label{eq:j_KG} \end{equation} $$ で与えられ、保存則 $\partial_\mu j^\mu=0$ を満たす。

導出

Klein-Gordon方程式\eqref{eq:KGeq}： $$ (\partial_t^2-\triangle-m^2)\psi(x)=0 $$ の複素共役をとる。 $$ (\partial_t^2-\triangle-m^2)\psi^\ast(x)=0 $$ Klein-Gordon方程式に左から $i\psi^\ast$ を掛けたものから、Klein-Gordon方程式の複素共役に右から $i\psi$ を掛けたものを引く。 $$ \begin{array}{rcc} i\psi^\ast \cdot (\partial_t^2-\triangle-m^2)\psi &= &0 \\ -)\qquad (\partial_t^2-\triangle-m^2)\psi^\ast \cdot i\psi &= &0 \\ \hline i\{ \psi^\ast(\partial_t^2\psi)-(\partial_t^2\psi^\ast)\psi \} -i\{ \psi^\ast(\triangle\psi)-(\triangle\psi^\ast)\psi \} &= &0 \end{array} $$ ここで $$ \begin{align*} \partial_t\{ \psi^\ast(\partial_t\psi)-(\partial_t\psi^\ast)\psi \} &= \{ \psi^\ast(\partial_t^2\psi)-(\partial_t^2\psi^\ast)\psi \} \\ \nabla\cdot \{ \psi^\ast(\nabla\psi)-(\nabla\psi^\ast)\psi \} &= \{ \psi^\ast(\triangle\psi)-(\triangle\psi^\ast)\psi \} \end{align*} $$ であるから、 $$ i\partial_t\{ \psi^\ast(\partial_t\psi)-(\partial_t\psi^\ast)\psi \} -i \nabla\cdot \{ \psi^\ast(\nabla\psi)-(\nabla\psi^\ast)\psi \} = 0 $$ が成り立つ。

四元ベクトルの確率流密度 $j^\mu(x) = (\rho(x),\,\bm{j}(x))$ について $$ \begin{align*} \rho(x) &= i\{ \psi^\ast(\partial_t\psi)-(\partial_t\psi^\ast)\psi \} \\ \bm{j}(x) &= -i\{ \psi^\ast(\nabla\psi)-(\nabla\psi^\ast)\psi \} \end{align*} $$ と定義する。
$\rho$ を実数にするため、係数 $i$ を付けて定義した。（$\rho=2\,\mathrm{Im}[(\partial_t\psi^\ast)\psi]$ となる）
$\partial_\mu = (\partial_t,\,\nabla)$ で書き直して $$ \partial_t\rho(x) + \nabla\cdot \bm{j}(x) = \partial_\mu j^\mu(x) = 0 $$ となる。

式\eqref{eq:j_KG}に平面波解\eqref{eq:KG_plainwave}を代入すると、確率密度は $$ \rho = j^0 = 2E|N|^2 $$ となります。$E\geq0$ のときは期待通り $\rho\geq0$ で問題ないのですが、$E<0$ のときは $\rho<0$ になり、Schrödinger方程式のときのような確率解釈が成立しません。
（場の量子論を知っている現代の立場からすると、$\rho$ は反粒子を考慮した電荷密度として正当化されますが、当時は第一量子化の範囲で正しい解釈ができる波動関数を探しています）

では、負エネルギー解は物理的におかしいとして無視すればいいでしょうか？
水素原子のエネルギー準位の計算みたいにエネルギー固有状態を考える分には、直ちに問題は発生しません。しかし、摂動論で散乱や遷移の振幅を計算しようとすると、無視するわけには行かない事情があります。

Klein-Gordon方程式の一般解は、式\eqref{eq:KG_plainwave}の平面波の重ね合わせであり、運動量のパラメータ $\bm{p}\in\mathbb{R}^3$ と $E$ の符号 $\pm$ の組み合わせで展開されます。
すなわち、正エネルギー解と負エネルギー解の両方が合わさって1つの完全系を構成します。 $$ \psi(x) = \int\!\frac{\mathrm{d}\bm{p}}{(2\pi)^3} \left[ N_+(\bm{p})\em^{-i(E_\bm{p}t-\bm{p}\cdot\bm{x})}+ N_-(\bm{p})\em^{-i(-E_\bm{p}t-\bm{p}\cdot\bm{x})} \right] $$ 平面波は非摂動ハミルトニアンの固有関数ですが、摂動項を含めた全ハミルトニアンの固有関数ではないため、初期時刻で係数 $N_-=0$ でも、他の成分から遷移して別の時刻では $N_-\neq0$ になり得ます。
その結果、確率解釈できない負エネルギー成分が出てきてしまうことになります。

なぜ確率密度が負になったのかを遡ると、$\rho$ が或る変数の絶対値の2乗ではなく $\rho\propto \psi^\ast\cdot(\partial_t\psi)+\mathrm{h.c.}$ という形で時間微分との積になるからです。運動方程式に $t$ の2階微分が含まれている限り、この問題は避けられません。（問1の導出で $\partial_t$ を$\{\,\cdots\,\}$ から括り出す所に注目）
そこで、時間の1階微分のみを線形に含んだ、Klein-Gordon方程式の代わりになる運動方程式を探す、ということがDirac方程式に至る動機となります。

行列 $\beta,\alpha_i$

時間微分について線形な運動方程式は $$ i\pdv{t}\psi(x) = \hat{H}\psi(x) $$ の形で表現されます。ここまではSchrödinger方程式と同じです。
Lorentz変換では時間と空間が対等に混ざり合うことから、時間微分に対応するハミルトニアン $\hat{H}$ は、空間微分に対応する運動量 $\hat{p}_i$ に対して線形になるべきです。
したがって、ハミルトニアンの一般形は、係数を $\beta,\alpha_i$ とおいて $$ \begin{equation} \hat{H} = \alpha_i\hat{p}_i +\beta m \label{eq:H_alphabeta} \end{equation} $$ と書けます。

式\eqref{eq:H_alphabeta}に対して、相対論的なエネルギーの関係式 $\hat{H}^2=\hat{\bm{p}}^2+m^2$ を満たすことを課します。
$\beta,\alpha_i$ は互いに交換しないものとして式変形すると $$ \begin{align*} \hat{H}^2 &= (\alpha_i\hat{p}_i+\beta m)(\alpha_j\hat{p}_j+\beta m) \\ &= \alpha_i^2\hat{p}_i^2 + \sum_{i>j}(\alpha_i\alpha_j+\alpha_j\alpha_i)\hat{p}_i\hat{p}_j +(\alpha_i\beta+\beta\alpha_i)\hat{p}_im+\beta^2 m^2 \end{align*} $$ $\hat{H}^2=\hat{\bm{p}}^2+m^2$ と比較すれば、以下の条件が導かれます：

$\beta, \alpha_1, \alpha_2, \alpha_3$ は互いに反交換
$\beta^2=\alpha_1^2=\alpha_2^2=\alpha_3^2=1$

$\beta,\alpha_i$ を単なる実数や複素数とすると、条件を満たすことはできません。ところが $\beta,\alpha_i$ を行列と考えれば、条件すべてを満たすようにできます。
さらに考察を進めると、$\beta,\alpha_i$ の最低次元の解は4次元のエルミート行列であることが分かります。順を追って導出します。

問2-1

$\beta,\alpha_i$ は複素係数で一次独立

導出

背理法で示す。一次従属であると仮定し、$\beta=c_1\alpha_1+c_2\alpha_2+c_3\alpha_3\;\;(c_i\in\mathbb{C})$ とおく。
このとき $$ \beta\alpha_1 = c_1\alpha_1^2+c_2\alpha_2\alpha_1+c_3\alpha_3\alpha_1 = c_1-c_2\alpha_1\alpha_2-c_3\alpha_1\alpha_3 $$ $$ \alpha_1\beta = c_1\alpha_1^2+c_2\alpha_1\alpha_2+c_3\alpha_1\alpha_3 = c_1+c_2\alpha_1\alpha_2+c_3\alpha_1\alpha_3 $$ 反交換関係 $\beta\alpha_1=-\alpha_1\beta$ が成り立つためには、$c_1=-c_1$ すなわち $c_1=0$ でなければならない。このとき $$ \beta\alpha_2 = c_2\alpha_2\alpha_2+c_3\alpha_3\alpha_2 = c_2-c_3\alpha_2\alpha_3 $$ $$ \alpha_2\beta = c_2\alpha_2\alpha_2+c_3\alpha_2\alpha_3 = c_2+c_3\alpha_2\alpha_3 $$ 反交換関係 $\beta\alpha_2=-\alpha_2\beta$ が成り立つためには、$c_2=-c_2$ すなわち $c_2=0$ でなければならない。このとき $$ \beta\alpha_3 = c_3\alpha_3\alpha_3=c_3 $$ $$ \alpha_3\beta = c_3\alpha_3\alpha_3=c_3 $$ 反交換関係 $\beta\alpha_3=-\alpha_3\beta$ が成り立つためには、$c_3=-c_3$ すなわち $c_3=0$ でなければならない。
したがって $\beta=0$ でなければならないが、条件 $\beta^2=1$ に矛盾する。
よって、$\beta,\alpha_1, \alpha_2, \alpha_3$ は一次独立である。

問2-2

$\beta,\alpha_i$ の固有値は $\pm1$

導出

$\beta$ の固有値を $\lambda$、固有ベクトルを $v$ とおくと、 $$ \beta v=\lambda v $$ と表せる。左から $\beta$ を掛けて $\beta^2=1$ を適用すると $$ v=\lambda \beta v = \lambda^2 v $$ よって、$\lambda^2=1$ すなわち $\lambda=\pm1$ である。$\alpha_i$ も $\beta$ と対称なので全く同じ。

問2-3

$\beta,\alpha_i$ のトレースは0

導出

$$ \begin{align*} \mathrm{Tr}(\alpha_i) &= \mathrm{Tr}(\alpha_i\beta\beta) \\ &= \mathrm{Tr}(\beta\alpha_i \cdot\beta) \\ &= \mathrm{Tr}(-\alpha_i\beta \cdot\beta) \\ &= -\mathrm{Tr}(\alpha_i) \end{align*} $$ 2行目へはトレースの巡回性（$\mathrm{Tr}(AB) = \mathrm{Tr}(BA)$）、3行目へは反交換関係 $\beta\alpha_i=-\alpha_i\beta$ を用いた。移項して $\mathrm{Tr}(\alpha_i)=0$ を得る。$\beta$ についても、上式で $\beta$ と $\alpha_i$ の役割を入れ替えて同様に示せる。

問2-4

$\beta,\alpha_i$ は偶数次元

導出

行列の固有値の総和はトレースに等しいことを利用する。
問2-2, 2-3より、$\beta,\alpha_i$ のトレースが0になるためには、固有値 $+1$ と固有値 $-1$ の重複度は等しくなければならない。
2つの固有値が同数存在するので、必ず偶数次元と決まる。

問2-5

$\beta,\alpha_i$ は4次元以上

導出

$\beta,\alpha_i$ を2次元行列で表現できないことを、背理法で示す。エルミート行列（$M^\dagger=M$）かつトレースが0である2次元行列の一般形は $$ M = \pmatrix{r_3 & r_1-ir_2 \\ r_1+ir_2 & -r_3} \quad(r_i\in\mathbb{R}) $$ と表すことができる。この式はPauli行列 $\bm{\sigma}=(\sigma^1,\sigma^2,\sigma^3)$ を用いて $$ M = r_1\sigma^1 +r_2\sigma^2 +r_3\sigma^3 $$ に書き直せる。
$\beta,\alpha_i$ が2次元で表せると仮定すると、これらはエルミート行列かつトレースが0なので $$ \beta = \sum_{k=1}^3 r_k^{(0)}\sigma^k \;,\;\; \alpha_i = \sum_{k=1}^3 r_k^{(i)}\sigma^k $$ と置ける。以下では記号を簡単にするため $\alpha_0=\beta$ と定義して、四元ベクトルではないが添字 $\mu=0,1,2,3$ で$\beta$ と $\alpha_i$ を指定する。

Pauli行列は反交換関係 $$ \{ \sigma^k,\,\sigma^l \} = 2\delta^{kl}I_2 $$ が成り立つので、 $$ \begin{align*} \{ \alpha_\mu,\,\alpha_\nu \} &= \sum_{k,l=1}^3 r_k^{(\mu)}r_l^{(\nu)} \{ \sigma^k,\,\sigma^l \} \\ &= \sum_{k,l=1}^3 r_k^{(\mu)}r_l^{(\nu)} \cdot 2\delta^{kl}I_2 \\ &= 2 \sum_{k=1}^3 r_k^{(\mu)}r_k^{(\nu)} I_2 \end{align*} $$ となる。
一方で、$\beta,\alpha_i$ は互いに反交換という条件なので $$ \sum_{k=1}^3 r_k^{(\mu)}r_k^{(\nu)} = 0 \quad\text{for}\;{}^\forall (\mu,\nu) \;,\; \mu\neq\nu $$ を満たす必要がある。
左辺は $k=1,2,3$ の3成分を持つベクトルの内積の形をしており、「3次元Euclid空間 $\mathbb{R}^3$ で互いに直交する4個のベクトル $\vec{r}^{(0)},\vec{r}^{(1)},\vec{r}^{(2)},\vec{r}^{(3)}$ が存在する」ことを主張している。しかし、そのようなベクトルの組を作ることはできないので矛盾する。
よって、$\beta,\alpha_i$ を2次元行列で表現することはできない。

1, 3次元を含む奇数次元は問2-4に反する。
4次元では、以下の本文中で示すように解が存在する。
単位行列のブロックを増やして、6次元以上に無駄に次数を上げることはできる。

問2-6

$\beta,\alpha_i$ はエルミート

導出

ハミルトニアン $\hat{H}$ のエルミート共役を考える。運動量 $\hat{p}_i$ はエルミート演算子なので $$ \hat{H}^\dagger = \alpha_i^\dagger\hat{p}_i +\beta^\dagger m $$ $\hat{H}$ もエルミート演算子なので、右辺は $\hat{H} = \alpha_i\hat{p}_i +\beta m$ と一致する。
任意の $\hat{p}_i,m$ について成り立つために、$\hat{p}_i,m$ の係数を比較して $$ \alpha_i^\dagger = \alpha_i \;,\;\; \beta^\dagger = \beta $$

これらの条件を満たす行列 $\beta,\alpha_i$ は、一意には決まりません。よく使われている例として
・Weyl表現 $$ \beta=\begin{pmatrix} O & I_2 \\ I_2 & O \end{pmatrix} \;\;,\quad \alpha_i=\begin{pmatrix} -\sigma^i & O \\ O & \sigma^i \end{pmatrix} $$・Dirac-Pauli表現 $$ \beta=\begin{pmatrix} I_2 & O \\ O & -I_2 \end{pmatrix} \;\;,\quad \alpha_i=\begin{pmatrix} O & \sigma^i \\ \sigma^i & O \end{pmatrix} $$があります。ここで $I_2$ は2次元単位行列、$\sigma^i$ はPauli行列を表します。

Dirac方程式とガンマ行列

ハミルトニアン\eqref{eq:H_alphabeta}を微分に置き換えて、波動関数 $\psi(x)$ に左から作用させると、次の微分方程式が得られます。 $$ \begin{equation} i\pdv{t}\psi(x) = \left(-i\alpha_i\pdv{x^i}+\beta m\right)\psi(x) \label{eq:H_alphabetadiff} \end{equation} $$

ここで遂に、ガンマ行列を $$ \begin{equation} \gamma^0 = \beta \;,\;\; \gamma^i = \beta\alpha_i \;\;\;(i=1,2,3) \label{eq:gamma_alphabeta} \end{equation} $$ と定義します。
式\eqref{eq:H_alphabetadiff}に左から $\beta$ を掛け、$\beta^2=1$ を適用すると $$ \begin{equation} (i\gamma^\mu\partial_\mu-m)\psi(x)=0 \label{eq:Diraceq} \end{equation} $$ となります。これがDirac方程式です。

記号を2つ導入します。
1つ目はDirac共役です。波動関数 $\psi(x)$ に対して $$ \bar{\psi}(x)=\psi^\dagger(x)\gamma^0 $$ と定義します。Lorentz変換の性質を議論する際に、基本的な量となります。

2つ目はFeynmanのスラッシュ記法です。任意の四元ベクトル $A_\mu=\eta_{\mu\nu}A^\nu$ に対し、ガンマ行列との縮約を $$ \slashed{A} = \gamma^\mu A_\mu = \eta_{\mu\nu}\gamma^\mu A^\nu $$ と定義します。これを用いると、Dirac方程式\eqref{eq:Diraceq}は $$ (i\slashed{\partial}-m)\psi(x)=0 $$ とかっこよく書くこともできます。

$\beta,\alpha_i$ が4×4行列であることに伴い、ガンマ行列 $\gamma^\mu$ は4×4行列となり、波動関数 $\psi(x)$ も4成分の列ベクトル $\psi={}^t(\psi_1\,\psi_2\,\psi_3\,\psi_4) $ に拡張されます。この4成分で表示された波動関数は、Lorentz変換に対する変換性からDiracスピノルとも呼ばれています。

上述したWeyl表現を採用して、超相対論極限（$|\bm{p}|\gg m$）におけるDirac方程式の平面波解を求めると $$ \psi(x)\propto \pmatrix{1 \\ 0 \\ 0 \\ 0}\em^{-i(E_\bm{p}t-\bm{p}\cdot\bm{x})} \,,\; \pmatrix{0 \\ 1 \\ 0 \\ 0}\em^{-i(E_\bm{p}t-\bm{p}\cdot\bm{x})} \,,\; \pmatrix{0 \\ 0 \\ 1 \\ 0}\em^{-i(-E_\bm{p}t-\bm{p}\cdot\bm{x})} \,,\; \pmatrix{0 \\ 0 \\ 0 \\ 1}\em^{-i(-E_\bm{p}t-\bm{p}\cdot\bm{x})} $$ という4つの独立な解が得られます。
詳細は割愛しますが、各成分は

$\psi_1$：ヘリシティ右巻き（スピンと運動の向きが同じ）の粒子
$\psi_2$：ヘリシティ左巻き（スピンと運動の向きが逆）の粒子
$\psi_3$：ヘリシティ右巻き（スピンと運動の向きが同じ）の反粒子
$\psi_4$：ヘリシティ左巻き（スピンと運動の向きが逆）の反粒子

と対応します。
また、Dirac-Pauli表現を採用すると、Dirac方程式の非相対論極限（$|\bm{p}|\ll m$）をとることでPauli方程式\eqref{eq:Paulieq}を導出することができます。
どの表現を採用するかによって成分ごとの意味は変化しますが、いずれにせよスピン1/2と粒子反粒子の計4自由度を含んでいると解釈できます。

ハーポルホード高橋

相対論的なエネルギーの式だけを拠り所にして、反粒子とスピンの概念が必然的に導かれる点が素晴らしい！

反交換関係

式\eqref{eq:gamma_alphabeta}で定義したガンマ行列 $\gamma^\mu$ には、以下の重要な性質があります。ここで、記号 $\{A,\,B\}=AB+BA$ は反交換子です。

問3

$\gamma^0 = \beta ,\; \gamma^i = \beta\alpha_i$ に対して $$ \begin{equation} \{\gamma^\mu,\,\gamma^\nu\} = 2\eta^{\mu\nu} \label{eq:gamma_anticommute} \end{equation} $$

導出

・$\mu=\nu=0$ のとき $$ \{\gamma^0,\,\gamma^0\} = 2\beta^2 = 2 $$

・$\mu=0,\,\nu=i\;(i=1,2,3)$ のとき $$ \begin{align*} \{\gamma^0,\,\gamma^i\} &= \beta\cdot\beta\alpha_i +\beta\alpha_i\cdot\beta \\ &= \beta\beta\alpha_i -\beta\beta\alpha_i \\ &= 0 \end{align*} $$ $\mu=i,\,\nu=0$ のときも同様。

・$\mu=i,\,\nu=j\;(i,j=1,2,3)$ のとき $$ \begin{align*} \{\gamma^i,\,\gamma^j\} &= \beta\alpha_i\cdot\beta\alpha_j +\beta\alpha_j\cdot\beta\alpha_i \\ &= -\beta\beta\alpha_i\alpha_j -\beta\beta\alpha_j\alpha_i \\ &= -\alpha_i\alpha_j -\alpha_j\alpha_i \end{align*} $$ $i\neq j$ のとき、$\alpha_i\alpha_j = -\alpha_j\alpha_i$ により右辺＝0となる。
$i=j$ のとき、$\alpha_i^2=1$ を用いて右辺＝-2となる。

以上と $\eta^{\mu\nu}=\mathrm{diag}[1,-1,-1,-1]$ を合わせて、$$\{\gamma^\mu,\,\gamma^\nu\} = 2\eta^{\mu\nu}$$ を得る。

式\eqref{eq:gamma_anticommute}は、ガンマ行列がMinkowski計量を持つベクトル空間上のClifford代数 $\mathrm{Cl}_{1,3}(\mathbb{R})$ の行列表現になっていることを意味します。

本記事では、歴史の流れに沿った方法でDirac方程式を導出しました。逆に式\eqref{eq:gamma_anticommute}をガンマ行列の定義として採用し、Lorentz群 $\mathrm{SO}^+(1,3)$ の代数関係を導くことにより、Lorentz不変性からDirac方程式に辿り着くこともできます。詳細は例えば
　M. E. Peskin, D. V. Schroeder, “An Introduction To Quantum Field Theory“, CRC Press, 2018.
を参照。

妥当性の確認

まずは、Dirac方程式\eqref{eq:Diraceq}からKlein-Gordon方程式\eqref{eq:KGeq}を再現できることを確かめます。

問4

スピノルの各成分 $\psi_\alpha \;(\alpha=1,2,3,4)$ について
$$ (\square +m^2)\psi_\alpha(x) = 0 $$

導出

Driac方程式\eqref{eq:Diraceq}の左から $\gamma^\mu\partial_\nu$ を掛ける。 $$ \begin{align*} \gamma^\mu\partial_\nu(i\gamma^\mu\partial_\mu-m)\psi &=0 \\ \therefore\quad i\gamma^\mu\gamma^\nu\partial_\mu\partial_\nu\psi -m\gamma^\nu\partial_\nu\psi &= 0 \end{align*} $$

第1項について、$\gamma^\mu\gamma^\nu = \frac{1}{2}\{\gamma^\mu,\,\gamma^\nu\} + \frac{1}{2}[\gamma^\mu,\,\gamma^\nu]$ より $$ \begin{align*} i\gamma^\mu\gamma^\nu\partial_\mu\partial_\nu\psi &= \frac{i}{2}(\{\gamma^\mu,\,\gamma^\nu\}+[\gamma^\mu,\,\gamma^\nu])\partial_\mu\partial_\nu\psi \\ &= \frac{i}{2}\{\gamma^\mu,\,\gamma^\nu\}\partial_\mu\partial_\nu\psi \\ &= \frac{i}{2}\cdot 2\eta^{\mu\nu} \cdot \partial_\mu\partial_\nu\psi \\ &= i\partial_\mu\partial^\mu\psi \\ &= i\square\psi \end{align*} $$ 2つ目の等号では、反対称な添字と対称な添字の縮約が0になることを用いた。

第2項についてはDirac方程式を適用して $$ \begin{align*} -m\gamma^\nu\partial_\nu\psi &= -m\cdot\frac{m}{i}\psi \\ &= im^2\psi \end{align*} $$ 以上から $$ i\cdot (\square+m^2)\psi =0 $$

次に、Dirac方程式\eqref{eq:Diraceq}がLorentz不変であることも分かります。方程式を分解すると$$ i\bar{\psi}\gamma^\mu\partial_\mu\psi -m\bar{\psi}\psi=0 $$となります。Lorentz変換に対して $\bar{\psi}\psi$ がスカラー、$\bar{\psi}\partial^\mu\psi$ がベクトルであることを認めれば、Lorentz不変性が言えます。
この部分は、ガンマ行列を全種類まとめて証明するほうが効率がよいので、別記事にまとめることにします。

そして、Dirac方程式に従う粒子の確率流密度を求めます。
まずは準備として、随伴方程式と呼ばれる式を導出しておきます。これはDirac方程式のエルミート共役から導かれる物であり、$\psi^\dagger(x)$ に対する方程式だと言えます。

問5

随伴方程式 $$ i\partial_\mu\bar{\psi}\gamma^\mu +m\bar{\psi}=0 $$

導出

Dirac方程式 $$ i\gamma^0\pdv{\psi}{t}+i\gamma^k\pdv{\psi}{x^k}-m\psi=0 $$ のエルミート共役をとると $$ -i\pdv{\psi^\dagger}{t}\gamma^{0\dagger}-i\pdv{\psi^\dagger}{x^k}\gamma^{k\dagger}-m\psi^\dagger=0 $$ $\gamma^{0\dagger}=\gamma^0,\; \gamma^{k\dagger}=-\gamma^k$ を用いると $$ -i\pdv{\psi^\dagger}{t}\gamma^0+i\pdv{\psi^\dagger}{x^k}\gamma^k-m\psi^\dagger =0 $$ 時空の添字を揃えるため、右から $\gamma^0$ を掛ける。 $$ -i\pdv{\psi^\dagger}{t}\gamma^0\gamma^0+i\pdv{\psi^\dagger}{x^k}\gamma^k\gamma^0-m\psi^\dagger\gamma^0 =0 $$ $\bar{\psi}=\psi\gamma^0,\;\{\gamma^0,\,\gamma^k\}=0$より $$ \begin{align*} -i\pdv{\psi^\dagger}{t}\gamma^0\gamma^0-i\pdv{\psi^\dagger}{x^k}\gamma^0\gamma^k-m\psi^\dagger\gamma^0 &=0 \\ -\left[ i\pdv{t}(\psi^\dagger\gamma^0)\gamma^0+i\pdv{t}(\psi^\dagger\gamma^0)\gamma^k+m\psi^\dagger\gamma^0 \right] &= 0 \\ \therefore\quad i\partial_\mu\bar{\psi}\gamma^\mu +m\bar{\psi} &=0 \end{align*} $$ なお、$\gamma^\mu$ は定数行列なので、微分演算子は作用しない。

この結果を用いて、確率密度流 $j^\mu$ を構成します。

問6

Dirac方程式\eqref{eq:Diraceq}に従う粒子の確率流密度は $$ j^\mu=\bar{\psi}\gamma^\mu\psi $$ で表されて、保存則 $\partial_\mu j^\mu=0$ を満たす。

導出

Dirac方程式の左から $\bar{\psi}$ を掛ける。 $$ i\bar{\psi}\gamma^\mu(\partial_\mu\psi)-m\bar{\psi}\psi=0 $$ 随伴方程式の右から $\psi$ を掛ける。 $$ i(\partial_\mu\bar{\psi})\gamma^\mu\psi+m\bar{\psi}\psi=0 $$ 2つの式を足すと $$ i\cdot \partial_\mu(\bar{\psi}\gamma^\mu\psi) +0 =0 $$ これにより、保存カレントが $j^\mu \propto \bar{\psi}\gamma^\mu\psi$ だと分かる。比例係数は、後述の通り $j^0$ が正になるように選ぶ。

したがって、確率密度に対応する第0成分 $\rho=j^0$ は $$ \rho = \psi^\dagger\gamma^0\gamma^0\psi = \psi^\dagger\psi \geq0 $$ となり、負の確率密度の問題が発生しなくなりました。波動関数が規格化されていれば、空間積分した全確率の和は1となります。

一方で、負エネルギー解の問題は、Dirac方程式でも引き続き残ります。Diracの1928年の原論文では反粒子の実在に否定的であったものの、のちに「Diracの海」として負のエネルギーを持つ粒子を正のエネルギーを持つ反粒子とみなす仮説が提案されます。
Andersonの霧箱実験による陽電子の発見は、1932年になってからのことです。より適切な反粒子の記述は、場の量子論の中で行われます。

参考文献

P. A. M. Dirac, “The Quantum Theory of the Electron”, Proc. R. Soc. A, 117(778), pp.610-624, 1928, https://royalsocietypublishing.org/rspa/article/117/778/610/2242/The-quantum-theory-of-the-electron.
ディラック著, 朝永振一郎ほか訳『量子力学原書第4版改訂版』岩波書店, 2017.
F. Halzen, A. D. Martin, “Quarks and Leptons“, John Wiley and Sons, 1984.