特殊相対性理論 (とくしゅそうたいせいりろん、独 :Spezielle Relativitätstheorie 、英 :Special relativity )は、あらゆる慣性系 間の等価性を公理とした物理学 の理論である。特殊相対論 (とくしゅそうたいろん)とも訳される。特殊相対性理論は一般相対性理論 に包含される理論であるが、一般相対論と特殊相対論を特に区別せずに、相対性理論 と呼称されることもある。光速に近い速度で相対移動する観測者対について古典力学 (ニュートン力学 )は一般に実験事実と整合しないが、特殊相対性理論においては、観測者に固有の(あるいは観測者間の互いの)時間と空間の測量について定式化することで、これらの関係・法則を捉える。
力学 において、電磁気学 の説くところによれば、観測者あるいは観測対象の慣性 運動を伴う実験において、その結果には従来のニュートン力学 の示すところと不整合が生じ得る (#特殊相対性理論に至るまでの背景 )。アルベルト・アインシュタイン は1905年 に発表した論文[ 1] において特殊相対性理論を発表し、電磁気学的現象まで含めた慣性系間の等価性を公理 として、以下の帰結を示した。
ある観測者に対する、時間の経過と空間中の移動速度との関係相対運動する座標系における時間の経過 相対運動する座標系における、“ローレンツ収縮”の空間上の形状にかかる効果 ある観測者にとって「同時」である事象が、別の観測者にとっては「同時」ではないこと(同時性の相対性 (英語版 ) ) 質量とエネルギーの等価性 特殊相対性理論はニュートン力学では説明できなかった事柄をことごとく説明しており、とりわけ、ニュートン力学が矛盾をきたす光速度に近い速度で運動する物体の力学的挙動に対して、その実験事実によく整合する。こういった経緯から、特殊相対性理論を含む相対性理論 は、現代物理学において重要な一体系として支持されている。定性的には、物体に対するエネルギーの放出・吸収にともなったその質量の減少・増加などが確認されている。
その名の通り、特殊相対性理論は一般相対性理論 に包含される特殊論である。一般相対性理論が重力 をはじめとする外力(あるいは慣性力)のある非慣性系 等の定式化を含むものであるのに対して、特殊相対性理論では慣性力のはたらかない状況(たとえば加減速のない状況)、すなわち慣性系 を主眼に据えて扱う。慣性系は非慣性系を含むあらゆる座標系の特殊・特別な場合のひとつであるので、本理論はこれを指すために「特殊」の語を冠して特殊相対論と呼称している。
ニュートン は力学 を記述するに当たって以下のような、「絶対時間と絶対空間 」を定義した。
「 絶対時間 その本質において外界とはなんら関係することなく一様に流れ、これを持続と呼ぶことのできるもの 絶対空間 その本質においていかなる外界とも関係なく常に均質であり揺らぎがないもの 」 —ニュートン (『プリンキピア 』[ 2] より)
すなわち、時間と空間は、そこにある物体の存在や運動に影響を受けないと仮定した[ 2] 。これをもって、我々が日常的直観として抱いている時間や空間に対する根本的感覚を表そうとした[ 2] 。この絶対時間をかかげるニュートン力学においても、あらゆる慣性系 は本質的に等価(すなわち相対的)でもある。ニュートン力学では、2つの慣性座標系(慣性系Aおよび慣性系B)における同一点A = (t ,x ) とB = (t′ ,x′ ) を示す関係は、次に示すガリレイ変換 によって結ばれている。
ここでt,x は慣性系Aにおける時刻と位置であり、t′,x′ は慣性系Bにおける時刻と位置である。v は、慣性系Aから見た慣性系Bの移動速度である。 狭義の例を示すならば、ある座標系Aに対して等速直線運動 する別の座標系Bがあるとして、これら二つの座標系は本質的に等価(相対的)である。すべての基準となる静止座標系といった概念は、上式では規定されておらず、力学の法則はあらゆる慣性系からの観測について本質的に同一である。すなわち、ガリレイ変換によって形式が変わらない。ガリレイ変換におけるニュートンの運動方程式 の不変性、すなわち、この変換でつながる座標系間の等価性は、ガリレオの相対性原理 (Galilean invariance ) と呼ばれる[疑問点 –ノート ] 。ニュートン力学は、少なくとも当時に再現し得た諸実験事実と整合し、その矛盾があらわになる時代を迎えるまで(以下節)、力学の普遍的法則とも捉えられた。
19世紀後半になると、当時既に知られていた電磁気学 に関するいくつかの基礎方程式群が、ジェームズ・クラーク・マクスウェル により系統化され、マクスウェル方程式 としてあらわされた。マクスウェル方程式の自由空間における解のひとつは電磁波 である。この解が示す電磁波の伝播速度は、当時知られていた精度での光速度 c とよく一致した。このため、光 と電磁波 が同一のものと捉えられ、マクスウェル方程式は、電磁気学の基礎方程式であるのみならず、光の挙動を記述する支配方程式とみなされるようになった。
同時期において光学 分野では、光の回折 現象が知られていた。これを説明するために、光を波の伝播と見做す光の波動説 が見出され、その支持が広まった。光の波動説では、光も空間を伝播する「もの」であるため、光が伝わる媒質であるエーテル なるものが宇宙に満たされているという仮説が、ホイヘンス により提案された。
光の波動説およびエーテルを前提とした議論では、エーテルに対して静止している理想的な座標系[ 注 1] [ 注 2] においてマクスウェル方程式は実験事実をよく支持し、有用な基礎物理方程式とみなされた。その一方で、エーテルに対して運動する基準系から見た状況について、次第に関心が寄せられるようになっていった。
ニュートン力学の基礎方程式であるニュートンの運動方程式は、ガリレイ変換による座標変換のもとで本質的には形を変えない。しかし、電磁気学の基礎方程式であるマクスウェル方程式は、ガリレイ変換のもとで形式が本質的に変化してしまう [ 注 3] 。この数式上の変化は、マクスウェル方程式が真に成り立つ慣性系がこの世界のどこかにあり、(形式を変化させずに)マクスウェル方程式が別の慣性系においても成立できる「ガリレイ変換でない新たな座標変換」が必要だと予想された。
ヘルツ はこの変形された方程式を運動座標系における電磁場の支配方程式として導出した[ 4] [ 5] が、Wilson や Röntgen–Eichenwald の実験によって否定された[ 6] [ 7] [ 8] 。当時の電磁気学についての問題提起として、たとえば以下のようなものが挙げられる。
光の伝播速度は実験的に光源の速度に依存しないことが判っている。にもかかわらず、その媒質(エーテル)が存在しないとすることは理解しがたい(よって、エーテルがあるに違いない)。 エーテルの存在を仮定するならば、エーテルに対して静止する「絶対静止系」が存在することになる [ 注 2] 。これは、絶対空間を否定する相対性原理に反し得る。[ 9] このような光の速度と観測者・光源の運動(運動する座標間の変換)に関して混迷した状況があり、なんらかの新たな実験及び理論が求められる状況であった。そのようななか、「ガリレイの相対性原理を是とし、光の速度が慣性系に依存する [ 9] のであれば、様々な異なる慣性系(運動座標系)から光の速度を計測すれば、マクスウェル方程式と一致する"ただ一つの静止基準系"が見つかるであろう」との発想からマイケルソン・モーリーの実験 [ 10] が行われた。
マイケルソン・モーリーの実験 (Michelson–Morley experiment )[ 10] にて、両氏は、地球の公転移動に着目した。実験空間の環境下において、公転運動の進行方向の前後に対してエーテルの「風」が吹くことを想定して、そこで伝播する2経路の光の干渉縞を見ることを通じて、光のエーテル中の伝播速度を精密に測定しようと試みた。これにより、エーテル中における観測者の移動速度(ここでは地球の公転速度)の影響を調べられると考えたのである。これは当時の技術で十分に機能できる手法であった[ 注 4] 。しかしながら、光の速度に有意の差異は認められず、両氏の期待した観測者移動速度の影響(「エーテルの風」の効果)は実験的に支持されなかった。この当時は「観測者の運動の光速度に及ぼす影響について、”予想されていた水準”よりは、無に近いか全く無いものであろう」と結論された。
一方で、上記の実験を支持できる物理体系を見出す試みとして、ヘルツ 、フィッツジェラルド 、ローレンツ 、ポアンカレ など[ 11] [ 12] の学者は、エーテル説に付け加えて、辻褄合わせのための仮定を付与することで実験事実と理論を整合させようと試みた。例えばローレンツとフィッツジェラルドは各々独立に、運動する物体が「エーテルの風」を受けて収縮するフィッツジェラルド=ローレンツ収縮 [ 13] [ 注 5] (ローレンツのエーテル理論 (英語版 ) )を提示した。フィッツジェラルド=ローレンツ収縮によって、マイケルソン・モーリーの実験では「エーテルの風」の効果がキャンセルされたと説明しており、その際の収縮の度合いを説明する座標変換式(ローレンツ変換 、Lorentz transformation [ 注 6] )を定式化した。しかしながら、この座標変換の理解のみでは検証可能性を欠いていた[ 注 7] 。他方で、ローレンツとポアンカレ は、時間の流れが観測者によって異なるとする「局所時間」という相対性理論の萌芽ともいえる思索を提起し[ 注 8] 、Wilson や Röntgen–Eichenwald の実験に合致できる電磁場の方程式を導出していた[ 15] 。
以上の理論はいずれも数式上は 実験事実と合致しており、現代物理学が支持するアインシュタインの理論とも整合する。すなわち、このような数式を持ち込みさえすれば、従来の物理理論との実験上の矛盾はひとまず解消されるということは、一定の成果ではあった。しかしこれらの理論は、あくまでもエーテル仮説(絶対空間の存在)と光速度不変則(実験事実)の食い違う部分のみを解消する為に導出された解決策に過ぎず、たとえば下記のような疑問について、理論上・実験上の不満を残した。
運動する物体が、実際に縮むことなどあり得るのか? 実際に縮むのであれば、その物体の破壊には影響するのか?[ 注 9] 数式上導入された「局所時間」を、物理学の体系としてどう解釈するのか?[ 注 10] 結局、以上までの一連の経緯を経て当時の物理学が得たものは、光速は不変という実験事実が分かったこと、および、時間や空間の絶対的均質性といった前提が揺らいだことであった。前提の思想として「絶対空間」や「絶対時間」に拘泥しがちな一方で、「絶対空間」ではないはずの実験環境下で精密測定される光の速度はどれも一定値(有意の差のない範囲で同一・不変)であり、それに整合する一応の理論は構築可能であった。このように、時間・空間に対する思想と実験結果に対する(いわば応急措置的な)理論の間に、ある種の不調和ともとれる状況があった。そういった従来の疑わしい前提を排除したうえで、新たに基礎的な物理法則体系を提唱・検証する必要が生じていた。これを成し遂げたのが、当時アマチュアの物理研究家であったアインシュタインであった。
アインシュタイン は、自身のいくつかの(主に3つの)論文[ 17] を通して、「特殊相対性理論 」を確立した。その大部分は、1つ目の論文「運動物体の電気力学について ON THE ELECTRODYNAMICS OF MOVING BODIES」に記されている。本節では、アインシュタインの「運動物体の電気力学について」を軸に据えつつ、後世の補足・解釈も踏まえながら、特殊相対性理論の基礎となる部分(公理と数学的準備)について説明する。
アインシュタインによる著作「運動物体の電気力学について」は、序文と10個の節からなる。第5節までは「力学」、第6節以降は「電気力学」とそれぞれ題されている。序文の中で「相対性原理 」と「光源の運動と無関係に光速は一定である 」という2つの前提が示されている。この2条件をもって、”静止物体のためのマクスウェル理論に基づいて運動物体を論ずるのに十分”と述べられている。
アインシュタインの原論文における特殊相対性理論では、以下の二つの事柄を指導原理(前提条件、公理)として、その物理学的枠組みが展開されている[ 18] [ 19] 。#特殊相対性理論に至るまでの背景 に述べた「エーテルに対して動いていない”特別なひとつの慣性系”が存在するはず」という思想からの脱却である。
特殊相対性原理 物理法則に関してすべての慣性系は対等である。すなわち、あらゆる慣性系において物理法則を記述する運動方程式は、その形式が不変である。 光速度不変の原理 真空中の光の速さは光源の運動状態に無関係である。 特殊相対性原理は運動方程式がある種の座標変換に関して共変であるべき、との原理である。なお、アインシュタインの最初の論文では単に「相対性原理」と呼ばれていた。のちに一般相対性理論が世に出てから、それと区別するために「特殊相対性原理」と呼ばれるようになった。光速度不変の原理は相対性理論構築に必要な最低限の要請をマクスウェル理論から抽出したものであり、物理的に新しい主張を含むのは特殊相対性原理のみである[ 20] 。
なお、現代では光速度不変の原理として以下のような表現を採用する流儀も多い[ 21] [ 22] 。
「真空中の光の速さは一定であり、どの慣性系で測定しても同じ値をとる」 しかし、これは本来、特殊相対性原理と(原論文の)光速度不変の原理から、次に記すように演繹される内容である。
いま、ある慣性系Sと、Sに対して一定方向に速さvで運動する慣性系S'を考える。光速度不変の原理より、慣性系Sにおいては、あらゆる光の速さが光源の運動状態によらず一定値をとる。ここではそれをcとする。同様に、慣性系S'においては、あらゆる光の速さがc'と観測されるとする。このとき、慣性系間の等価性を主張する特殊相対性原理に従うならば、c' = cであることが言える[ 注 11] 。すなわち、「全ての慣性系において、あらゆる光源からの光の速さは一定値cである」という主張は、アインシュタインの原論文の二つの指導原理から導出可能である。このように、光の速さのような物理定数[ 注 12] は全ての慣性系で同一の値をとることを、特殊相対性原理は含意しているのである[ 23] [ 24] 。 以上の指導原理に加えて、主に次の2つの要請を満たすことを要求としたうえで、特殊相対性理論は構築されている。
「特殊相対性理論は、電磁気学(マクスウェル方程式)と整合するべきである」 光の支配方程式とされるマクスウェル方程式には、当時は観測者の運動の効果(慣性系から別の動く慣性系への座標変換への対応)が抜けているとされていた。しかし、光速度を不変とする特殊相対性理論の思想的枠組みを取り入れれば、座標変換を考慮に含めても、マクスウェル方程式自体は修正不要であることが示されている(#特殊相対性理論における電磁気学 )。 「特殊相対性理論の成果は、それまでのニュートン力学と両立すべきである」 特殊相対性理論で用いる慣性座標系間の変換則は、非相対論的極限 (v /c → 0 ) においてガリレイ変換に漸近する(ここでv は2つの慣性座標系間の速度で、c は真空中の光速度である[ 21] )。そのため、この条件下では、ガリレイ変換のもとで不変のニュートン力学との齟齬はないことが示されている。 なお、これら指導原理や諸要請の他にも、従来の物理学から継承される「空間の等質性」や「空間の等方性」といった暗黙の前提は、特殊相対性理論においても基礎とされている。
以上の指導原理と諸要請・前提を満たすべく、特殊相対性理論においては、2つの慣性系 の間の座標変換則を次のように導入する(実際に特殊相対性理論で用いられる座標変換「ローレンツ変換 」を導く)。以下では、c を不変の光速度 とし、時刻t の代わりにc を乗じたct を用いることとして、時間軸と空間軸を統一的に扱って述べる。
今、慣性運動する2人の観測者(すなわち何ら外力 のかかっていない観測者)A 、B がある一点ですれ違ったとする。A の慣性系における位置と時刻を表す座標系を(ct ,x ) 、B の慣性系における位置と時刻を表す座標系を(ct ′,x ′) とする。ここで、2つの時刻ct 、ct′ は各観測者に独立なものである。すなわち、特殊相対性理論においてここでまさに、絶対時間が放棄されている(二人の観測者に共通の「絶対時間」はどこにも存在しない)[ 25] 。もちろん、位置座標軸も各観測者に独立固有の存在であり、二人の観測者に共通の空間的尺度「絶対空間」もない。なお、以降では便宜上、二人の観測者がすれ違った際に、位置と時刻の起点(一般に原点・ゼロ点)を規定することが多いが、位置と時刻の起点は再現性のある然るべき手段によって適宜取り直してもよい。また、二人の観測者に共通の絶対時間も絶対空間も存在せず不可知である一方で、それぞれの観測者が(何らかの手段で)もう一方の観測者が観測した時刻・位置の値を知ることは一般に妨げられない[ 注 13] 。
ここで、2つの座標系の間の一般的な変換規則の数学表現として、テイラー展開 による座標変換規則をまず考える。(ct ,x ) あるいは(ct ′,x ′) という表現から示唆されるように、各慣性系での時刻・空間座標の数値の組は4次元の行ベクトル・列ベクトルとして扱える(時刻(1次元)と空間(3次元)をあわせた4次元。下記では縦ベクトル(列ベクトル)の表記を用いる)。一般に座標変換規則は、何らかの定数ベクトルb→ と行列 Λ (この場合では4行4列の行列)とを用いて、次のように記述できる。
( c t ′ x ′ ) = b → + Λ ( c t x ) + {\displaystyle {\begin{pmatrix}ct'\\{\boldsymbol {x}}'\end{pmatrix}}={\vec {b}}+\Lambda {\begin{pmatrix}ct\\{\boldsymbol {x}}\end{pmatrix}}+} (二次以上の項)A とB が最も接近してすれ違った際において、位置と時刻を双方の座標系の原点と定めると、b → = 0→ と簡略化することができる。また、特殊相対性理論においては、外力の無い慣性系を前提とする。このことから、上式の二次以上の項はゼロとできる(二次以上の項があると、A とB が相互に加速度運動していることとなり、慣性系であるという要請から外れる[ 25] )。以上の諸仮定をもとに、次に示す線形変換 の形態として、特殊相対性理論に則った座標変換則を得ることができる。
( c t ′ x ′ ) = Λ ( c t x ) {\displaystyle {\begin{pmatrix}ct'\\{\boldsymbol {x}}'\end{pmatrix}}=\Lambda {\begin{pmatrix}ct\\{\boldsymbol {x}}\end{pmatrix}}} すなわち、特殊相対性理論においては、物理現象は4次元のベクトル空間で記述される。慣性系はその4次元ベクトル空間の基底であり、各慣性系の間の座標変換は行列Λ による線形写像である 。
上記であつかった空間の3次元に時刻(1次元)を加えた4次元の時空間における点を世界点 と呼ぶ[ 26] 。
ある慣性座標系から見て、ある時刻t 1 に、3次元空間上のある位置x 1 を光が通過したとする。その後、この光が時刻t 2 に位置x 2 まで伝播したとする。光速度は不変量c であるので、これは
| x 1 − x 2 | | t 1 − t 2 | = c {\displaystyle {\frac {|{\boldsymbol {x}}_{1}-{\boldsymbol {x}}_{2}|}{|t_{1}-t_{2}|}}=c} すなわち、
c 2 ( t 1 − t 2 ) 2 − | x 1 − x 2 | 2 = 0 {\displaystyle c^{2}(t_{1}-t_{2})^{2}-|{\boldsymbol {x}}_{1}-{\boldsymbol {x}}_{2}|^{2}=0} である事を意味する[ 26] 。
世界点 1 と世界点 2 の間に定義される量
s 12 := c 2 ( t 1 − t 2 ) 2 − | x 1 − x 2 | 2 {\displaystyle s_{12}:={\sqrt {c^{2}(t_{1}-t_{2})^{2}-|{\boldsymbol {x}}_{1}-{\boldsymbol {x}}_{2}|^{2}}}} を世界間隔 [ 26] もしくは世界距離 [要出典 ] と呼ぶことにする。ある慣性系においてs 12 2 = 0 が成り立つならば、特殊相対性原理から、他の任意の慣性系でもs ′12 2 = 0 が成り立つことになる。ここで、微分表現を採用して、これらの微小世界間隔を次のように表記する。
d s 2 := c 2 ( d t ) 2 − | d x | 2 , d s ′ 2 := c 2 ( d t ′ ) 2 − | d x ′ | 2 {\displaystyle \mathrm {d} s^{2}:=c^{2}(\mathrm {d} t)^{2}-|\mathrm {d} {\boldsymbol {x}}|^{2},\quad \mathrm {d} s'^{2}:=c^{2}(\mathrm {d} t')^{2}-|\mathrm {d} {\boldsymbol {x'}}|^{2}} これらは同次微小量であることから、
d s 2 = a d s ′ 2 {\displaystyle \mathrm {d} s^{2}=a\mathrm {d} s'^{2}} という関係式が成り立つ。ここで、この係数a は時間と空間の一様性から時間と座標に依存せず、空間の等方性から慣性系間の相対速度の方向に依存しないことが要請される。したがって、慣性系間の相対速度の絶対値にのみ依存する[ 26] 。特殊相対性理論において、微小世界間隔の不変性、すなわち、a (|V |) ≡ 1 であることを示す手法は、たとえば以下の2つが存在する。
2つの慣性系K 1 ,K 2 の間の相対速度をV とすると、それぞれの慣性系における微小世界間隔ds 1 , ds 2 および係数a (|V |) についての関係式として、逆変換に対する要請から
d s 1 2 = a ( | V | ) d s 2 2 , d s 2 2 = a ( | − V | ) d s 1 2 {\displaystyle \mathrm {d} s_{1}{}^{2}=a(|{\boldsymbol {V}}|)\mathrm {d} s_{2}^{2},\quad \mathrm {d} s_{2}{}^{2}=a(|{\boldsymbol {-}}V|)\mathrm {d} s_{1}{}^{2}} が得られ、代入してa ( | V | ) 2 = 1 {\displaystyle a(|{\boldsymbol {V}}|)^{2}=1} が得られる[ 27] 。a (|V |) > 0 より[ 注 14] a (|V |) ≡ 1 が得られる。
三つの慣性系K 1 ,K 2 ,K 3 の間の相対速度をV 12 ,V 23 ,V 31 とすると、それぞれの慣性系における微小世界間隔ds 1 , ds 2 , ds 3 および係数a (|V |) についての関係式として
d s 1 2 = a ( | V 12 | ) d s 2 2 , d s 2 2 = a ( | V 23 | ) d s 3 2 , d s 3 2 = a ( | V 31 | ) d s 1 2 , {\displaystyle \mathrm {d} s_{1}{}^{2}=a(|{\boldsymbol {V}}_{12}|)\mathrm {d} s_{2}^{2},\quad \mathrm {d} s_{2}{}^{2}=a(|{\boldsymbol {V}}_{23}|)\mathrm {d} s_{3}^{2},\quad \mathrm {d} s_{3}{}^{2}=a(|{\boldsymbol {V}}_{31}|)\mathrm {d} s_{1}^{2},} ∴ a ( | V 12 | ) a ( | V 23 | ) = a ( | V 31 | ) {\displaystyle \therefore {\frac {a(|{\boldsymbol {V}}_{12}|)}{a(|{\boldsymbol {V}}_{23}|)}}=a(|{\boldsymbol {V}}_{31}|)} が得られる。後者の左辺はV 12 ,V 23 の絶対値にのみ依存するのに対し、右辺のV 31 はV 12 ,V 23 間の角度にも依存すると考えられるため、a (|V |) はV によらず、定数であることがわかる[ 26] 。(ここで、ニュートン力学とは異なり、相対性理論ではガリレイ変換は成立せず[ 28] 、V 31 ≠ − V 12 − V 23 {\displaystyle {\boldsymbol {V}}_{31}\neq -{\boldsymbol {V}}_{12}-{\boldsymbol {V}}_{23}} であることに注意せよ。)さらに、関係式からa (|V |) ≡ 1 が得られる[ 26] 。
以上二つのいずれを採用するにせよ、微小世界間隔はあらゆる慣性系間で保存されることになる(座標変換に関して不変)。したがって、このような微分の集積である有限の世界間隔についても、慣性系間の座標変換を経ても不変の保存量となる。
世界距離の定義から、以下の内積風の二項演算子
η ( ( c t , x , y , z ) , ( c t ′ , x ′ , y ′ , z ′ ) ) := ( c t ) ⋅ ( c t ′ ) − x x ′ − y y ′ − z z ′ {\displaystyle \eta ((ct,x,y,z),(ct',x',y',z')):=(ct)\cdot (ct')-xx'-yy'-zz'} を考えると、世界距離の二乗はη ((ct,x,y,z ),(ct,x,y,z )) に一致する。このような二項演算子η をミンコフスキー内積 もしくはミンコフスキー計量 と呼び、ミンコフスキー内積の定義されたベクトル空間をミンコフスキー空間 と呼ぶ。ミンコフスキー空間上の点を世界点 もしくは事象 [ 29] と呼び、ミンコフスキー空間のベクトルは通常の3次元のベクトルと区別する為、4元ベクトル という[ 注 15] 。
なお、世界点P は、P と原点O とを結ぶ4元ベクトルO P → {\displaystyle {\overrightarrow {\mathrm {OP} }}} と自然に同一視できるので、以下、表現に紛れがなければ世界点を4元ベクトルとして表現する。
特殊相対性理論では、時空間をミンコフスキー空間として記述する。
4元ベクトルa→ に対しη (a → ,a → ) が非負であれば
をミンコフスキー・ノルム といい、世界点a→ 、b→ に対し、η (a → −b → ,a → −b → ) が非負であればη (a → −b → ,a → −b → ) の平方根をa→ 、b→ の世界距離 という。
なお、世界「距離」という名称ではあるが、
負の値や虚数 も取りうる 0ベクトルでなくとも世界距離が0になることがある といった点から数学的な距離の公理 を満たさない。
また、||a→ || は常に定義できるとは限らないばかりかミンコフスキー・ノルムが定義できる値に対しても三角不等式 の逆向き の不等式
が成り立つ事から、ミンコフスキー・ノルムも数学で通常使われるノルム の定義を満たさない。
本項では、ミンコフスキー内積を
η ( ( c t , x , y , z ) , ( c t ′ , x ′ , y ′ , z ′ ) ) = ( c t ) ⋅ ( c t ′ ) − x x ′ − y y ′ − z z ′ {\displaystyle \eta ((ct,x,y,z),(ct',x',y',z'))=(ct)\cdot (ct')-xx'-yy'-zz'} としたが、書籍によっては符号を逆にした
η ( ( c t , x , y , z ) , ( c t ′ , x ′ , y ′ , z ′ ) ) = − ( c t ) ⋅ ( c t ′ ) + x x ′ + y y ′ + z z ′ {\displaystyle \eta ((ct,x,y,z),(ct',x',y',z'))=-(ct)\cdot (ct')+xx'+yy'+zz'} をミンコフスキー内積としているものもあるので注意が必要である。
本項と同じ符号づけを時間的規約 、本項とは反対の符号づけを空間的規約 と呼んで両者を区別する。
また本項ではミンコフスキー内積をη で表したが、g で表したり、両者を混用することもある。例えば佐藤 (1994) は、特殊相対性理論にはη を用いる一方で一般相対性理論ではg を用いている。またシュッツ (2010) ではミンコフスキー内積にはg を用いてその行列表示はη としている。
V をn 次元実ベクトル空間とし、
η : V × V → R {\displaystyle \eta \colon V\times V\to \mathbb {R} } をV 上の対称二次形式 とする。このとき、V の基底e → 1 , ...,e → n と非負整数p 、q が存在し、
η ( ∑ μ a μ e → μ , ∑ ν b ν e → ν ) = a 1 b 1 + ⋯ + a p b p − a p + 1 b p + 1 − ⋯ − a p + q b p + q {\displaystyle \eta \left(\sum _{\mu }a^{\mu }{\vec {e}}_{\mu },\sum _{\nu }b^{\nu }{\vec {e}}_{\nu }\right)=a^{1}b^{1}+\cdots +a^{p}b^{p}-a^{p+1}b^{p+1}-\cdots -a^{p+q}b^{p+q}} が成立する事が知られている。しかもp 、q は(V ,η ) のみに依存し、基底e → 1 , ...,e → n には依存しない(シルヴェスターの慣性法則 )。
p = 1 、q =n − 1 となる二次形式η をミンコフスキー計量 と呼び、組(V ,η ) をn 次元ミンコフスキー空間 という。
特殊相対性理論で用いるのは、次元n が4の場合なので、以下特に断りがない限り、n = 4 とする。
時間1次元+空間2次元のミンコフスキー空間を描いた抽象図。 過去光円錐の範囲内において発生した森羅万象の結果が観測者の示す中心点へと集まり、その結果に対する森羅万象が未来光円錐の範囲内へと時間軸に沿って広がっていく様を表現している。 空間方向の次元を2に落としたミンコフスキー空間を図示した。図では何らかの慣性系から見たミンコフスキー空間が描かれており、この慣性系に対して静止している観測者 (observer) が原点にいる。この観測系における座標の成分表示を(ct ,x ,y ) とする。
この観測者にとっての時間軸 (ct , 0, 0) は図で「時間」と書かれた軸であり、この観測者にとって時間は時間軸にそって流れる。従って図の上方が未来 であり、下方が過去 である。観測者が慣性系に対して静止している事を仮定したので、時間がt 秒経つと、観測者のミンコフスキー空間上の位置は(ct , 0, 0) に移る。
一方、この観測者にとって現在 にある世界点の集まり(すなわちこの観測者にとっての空間方向)は図の「現在」と書かれた平面であり、この観測者からみた空間方向の座標軸(0,x , 0), (0, 0,y ) が「空間」と書かれた二本の軸である。
世界距離の定義から、原点を通る光の軌跡は
(ct )2 −x 2 −y 2 = 0 を満たす。この方程式を満たす世界点の集合は2つの円錐として描かれ、これを光円錐 という。図の上にある逆さまの円錐が未来の光円錐 (future light cone) であり、図の下にある円錐が過去の光円錐 (past light cone) である。
原点を通る光の軌跡は、光円錐上にある直線である。観測者は光を使って物をみるので、過去の光円錐の上にある世界点が観測者に見える(もちろん、他の物体に遮られなければ)。
ミンコフスキー空間上の4元ベクトルx→ の終点が(未来もしくは過去の)光円錐の内側にあるときx→ は時間的 であるといい、終点が光円錐の外側にあるときx→ は空間的 であるといい、光円錐上にあるときx→ は光的 であるという。定義より明らかに、以下が成り立つ:x→ が時間的、空間的、光的であるのは、η (x → ,x → ) がそれぞれ正、負、0のときである。
光円錐上の点x→ はη (x → ,x → ) という座標系と無関係な値の符号で特徴づけられるので、4元ベクトルが時間的か、空間的か、光的かは原点を起点するどの慣性座標系からみても不変である 事がわかる。特に、光円錐は原点を起点するどの慣性座標系からみても同一である。
原点Oを通る観測者から見た慣性座標系を一つ固定すると、前述のようにその慣性座標系における二つの位置ベクトル間のミンコフスキー内積は
η ( ( c t , x , y , z ) , ( c t ′ , x ′ , y ′ , z ′ ) ) = ( c t ) ⋅ ( c t ′ ) − x x ′ − y y ′ − z z ′ {\displaystyle \eta ((ct,x,y,z),(ct',x',y',z'))=(ct)\cdot (ct')-xx'-yy'-zz'} (M1)
と書ける。このような座標系で、
e → 0 := ( 1 0 0 0 ) {\displaystyle {\vec {e}}_{0}:={\begin{pmatrix}1\\0\\0\\0\end{pmatrix}}} 、e → 1 := ( 0 1 0 0 ) {\displaystyle {\vec {e}}_{1}:={\begin{pmatrix}0\\1\\0\\0\end{pmatrix}}} 、e → 2 := ( 0 0 1 0 ) {\displaystyle {\vec {e}}_{2}:={\begin{pmatrix}0\\0\\1\\0\end{pmatrix}}} 、e → 3 := ( 0 0 0 1 ) {\displaystyle {\vec {e}}_{3}:={\begin{pmatrix}0\\0\\0\\1\end{pmatrix}}} と定義すると、e → 0 、e → 1 、e → 2 、e → 3 はあきらかにミンコフスキー空間の基底であり、しかも
を満たす。
ユークリッド空間の類似から(M2) 式を満たす基底e → 0 、e → 1 、e → 2 、e → 3 を正規直交基底 [ 30] と呼ぶ事にすると、慣性座標系から正規直交基底が1つ定まった事になる。e → 0 をこの基底の時間成分 といい、e → 1 、e → 2 、e → 3 をこの基底の空間成分 という。
逆に(M2) 式の意味で正規直交基底であるe → 0 、e → 1 、e → 2 、e → 3 を一つ任意に選び、この基底における座標の成分表示を(ct ,x ,y ,z ) と書くことにすると、ミンコフスキー内積が(M1) 式を満たすことを簡単に確認できる。
以上の議論から、原点にいる観測者の慣性座標系と正規直交基底は1対1に対応する 事がわかる。従って以下両者を同一視する。
ただし、正規直交基底の中には、e → 0 が過去の方向を向いていたり、e → 1 、e → 2 、e → 3 が左手系だったりするものもあるので、このようなものは以下除外して考えるものとする[ 注 16] 。
運動している質点がミンコフスキー空間内に描く軌跡を世界線 と言う。今、世界線が原点を通る直線となる質点の運動があるとし、その直線の(4元)方向ベクトルをu→ とする(長さは問わない)。
この質点の運動を慣性座標系e → 0 、e → 1 、e → 2 、e → 3 にいる観測者A が原点で眺めるとする。この慣性座標系におけるu→ の成分表示を(ct ,x ,y ,z ) とすると、3次元ベクトル(x /t ,y /t ,z /t ) はA から見た質点の速度ベクトルであると解釈できる。
次にu→ の速度を光速と比較してみる。u→ の速度が光を下回る必要十分条件は、√ x 2 +y 2 +z 2 /t <c となることであるので、これを書き換えると、(ct )2 −x 2 −y 2 −z 2 > 0 となる。ミンコフスキー計量の定義より、この式はη (u → ,u → ) > 0 と慣性座標系によらない形で 表現できる。従って、η (u → ,u → ) > 0 であれば、どの慣性系から見ても 光速度を下回り、逆にη (u → ,u → ) < 0 であればどの慣性系から見ても 光速度を上回る。
前述のようにη (u → ,u → ) の正負によって、u→ を時間的もしくは空間的と呼ぶので、まとめると以下が結論づけられる:
方向ベクトルu→ が時間的 ⇔ 質点はどの慣性系から見ても光速を下回る 方向ベクトルu→ が空間的 ⇔ 質点はどの慣性系から見ても光速を上回る 方向ベクトルu→ が光的 ⇔ 質点はどの慣性系から見ても光速と等しい 最後のものは光速度不変の原理からの直接の帰結でもある。
なお、上の議論では、質点の世界線が直線である事を仮定したが、そうでない場合も原点での接線をu→ として同様の議論をする事で同じ結論が得られる。
ローレンツ変換 とは、ミンコフスキー空間V 上の線形変換 φ :V →V でミンコフスキー計量を変えないもの、すなわち任意の4元ベクトル a→ 、b→ に対し、
η ( φ ( a → ) , φ ( b → ) ) = η ( a → , b → ) {\displaystyle \eta (\varphi ({\vec {a}}),\varphi ({\vec {b}}))=\eta ({\vec {a}},{\vec {b}})} が成立するものの事である。
ユークリッド空間で内積 を変えない線形変換は合同変換 であるので、ローレンツ変換とは、ミンコフスキー空間における合同変換の対応物である。
ただし正規直交基底の場合と同様、ローレンツ変換にも
空間方向の向きを保たないもの 時間方向の向きを保たないもの が存在するのでこのようなものは以下除外して考える[ 注 17] 。
なお、空間方向の向き、時間方向の向きの両方を保つローレンツ変換を正規ローレンツ変換 という事があるが[ 31] 、本項では以下、特に断りがない限り、単にローレンツ変換と言ったならば正規ローレンツ変換を指すものとする。
ローレンツ変換 φ と4元ベクトル b→ を使って
f (x → ) =φ (x → ) +b → の形に書ける線形変換 をポアンカレ変換 という。特殊相対性理論では、2人の観測者が原点 で出会ったケースにおいてローレンツ変換に関して議論する事が多いが、これは出会った場所を原点に平行移動した上で議論しているという事なので、実質的にはポアンカレ変換に関する議論である事が多い。
4次元ミンコフスキー空間(V ,η ) では、 次の定理が成立する事が知られている。
定理 ― (e → 0 ,e → 1 ,e → 2 ,e → 3 ) 、(e′ → 0 ,e′ → 1 ,e′ → 2 ,e′ → 3 ) をV の2組の正規直交基底とする。
このとき、V 上の線形変換φ で
( e → 0 ′ , e → 1 ′ , e → 2 ′ , e → 3 ′ ) = ( φ ( e → 0 ) , φ ( e → 1 ) , φ ( e → 2 ) , φ ( e → 3 ) ) {\displaystyle {\begin{aligned}&({\vec {e}}'_{0},{\vec {e}}'_{1},{\vec {e}}'_{2},{\vec {e}}'_{3})\\&=(\varphi ({\vec {e}}_{0}),\varphi ({\vec {e}}_{1}),\varphi ({\vec {e}}_{2}),\varphi ({\vec {e}}_{3}))\end{aligned}}} (L1)
を満たすものがただ一つ存在し、しかもφ はローレンツ変換である。
この定理はユークリッド空間における2つの正規直交基底が直交変換により写りあう事の類似である。
前述のように、正規直交基底は慣性座標系と対応している。よって上の定理は、以下を意味する:慣性座標系から別の慣性座標系への座標変換はローレンツ変換である。
ローレンツ変換の図示。(ct,x) を(ct',x') に変換する様子がζ ≈ +0.66 に対して描かれている。 ローレンツ変換の具体的な形を求める為、まずは基底をより解析がしやすいものに置き換える。
基底e → 0 ,e → 1 ,e → 2 ,e → 3 の「空間部分」であるe → 1 ,e → 2 ,e → 3 の張るミンコフスキー空間上の部分空間をE とし、同様に基底e′ → 0 ,e′ → 1 ,e′ → 2 ,e′ → 3 の空間部分であるe′ → 1 ,e′ → 2 ,e′ → 3 の張るミンコフスキー空間上の部分空間をE′ とする。これらはそれぞれの慣性座標系における空間方向を表している。
e → 1 ,e → 2 ,e → 3 をE 内で回転した別の正規直交基底に取り替えても、e → 0 ,e → 1 ,e → 2 ,e → 3 と実質的に同じ慣性系を表しているとみなしてよい。そこで(e → 1 ,e → 2 ,e → 3 ), (e′ → 1 ,e′ → 2 ,e′ → 3 ) をそれぞれE 内、E′ 内で回転することで、ローレンツ変換φ の行列表示Λ を簡単な形で表すことを試みる[ 注 18] 。
E とE′ の共通部分E ∩E′ をU とすると、U は4次元ベクトル空間上の2つの3次元部分ベクトル空間の共通部分なので、U は2次元(以上)のベクトル空間である。従ってE 内で(e → 1 ,e → 2 ,e → 3 ) を回転することで、e → 2 ,e → 3 ∈U としてよく、同様にE′ 内の回転によりe′ → 2 ,e′ → 3 ∈U とできる。最後にU 内でe → '1 ,e → '2 を回転することでe′ → 2 =e → 2 、e′ → 3 =e → 3 としてよい。
これらの基底に対し、(L1) 式を満たすローレンツ変換φ の行列表現をΛ = (Λμ ν )μν とする。これはすなわち、
( e → 0 ′ , e → 1 ′ , e → 2 ′ , e → 3 ′ ) = ( e → 0 , e → 1 , e → 2 , e → 3 ) Λ {\displaystyle ({\vec {e}}'_{0},{\vec {e}}'_{1},{\vec {e}}'_{2},{\vec {e}}'_{3})=({\vec {e}}_{0},{\vec {e}}_{1},{\vec {e}}_{2},{\vec {e}}_{3})\Lambda } を満たすという事であり、これら2つの基底における座標の成分表示をそれぞれ(ct ,x ,y ,z ) 、(ct ′,x ′,y ′,z ′) とすると
が成立するという事でもある。
e′ → 2 =e → 2 、e′ → 3 =e → 3 であったので、ローレンツ変換の行列表示は、
Λ = ( ∗ 1 1 ) {\displaystyle \Lambda =\left({\begin{array}{cc|cc}*&&&\\&&&\\\hline &&1&\\&&&1\end{array}}\right)} という形であり、ローレンツ変換がミンコフスキー空間における「回転」であったことを利用すれば、上の行列の(*)の部分が、
( cosh ζ − sinh ζ − sinh ζ cosh ζ ) {\displaystyle \left({\begin{array}{cc}\cosh \zeta &-\sinh \zeta \\-\sinh \zeta &\cosh \zeta \end{array}}\right)} という形であることがわかる。これを導く厳密な方法はいくつかあるが、簡便な方法としては虚数単位 i を用いて時間軸をτ =ict と置く事で通常のユークリッド空間の回転とみなせる(ウィック回転 )という事実を使うものがある。
最終的に2つの基底における座標の成分表示の関係(L2) 式は以下のように書ける事がわかる。
定理(ローレンツ変換の具体的な形) ― 必要なら空間方向の座標軸を回転させる事で、ローレンツ変換は
と表示できる[ 注 19] 。
この値ζ は正規直交基底の取り方に依存せず、ローレンツ変換φ の固有値 のみによって決まることが知られており、ζ をφ のラピディティ という。なお、ζ は
ζ = arccosh ( η ( e → 0 , e → 0 ′ ) ) {\displaystyle \zeta =\operatorname {arccosh} (\eta ({\vec {e}}_{0},{\vec {e}}'_{0}))} と具体的に求めることもできる。
慣性座標系(ct ,x ,y ,z ) にいる観測者A は、原点を通過した後、(ct , 0, 0, 0) という直線(世界線 )にそって進んでいく。この様子を別の観測者B の慣性座標系(ct ′,x ′,y ′,z ′) で記述した式は(L3) 式に(x ,y ,z ) = (0, 0, 0) を代入した
( c t ′ x ′ y ′ z ′ ) = ( c t cosh ζ − c t sinh ζ 0 0 ) {\displaystyle {\begin{pmatrix}ct'\\x'\\y'\\z'\end{pmatrix}}={\begin{pmatrix}ct\cosh \zeta \\-ct\sinh \zeta \\0\\0\end{pmatrix}}} によって表現できる。この世界線の「傾き」
x ′ / t ′ = − c tanh ζ {\displaystyle x'/t'=-c\tanh \zeta } は2人の観測者の相対速度と解釈できるので、観測者A から見た観測者B の相対速度をv とすると、
v = c tanh ζ {\displaystyle v=c\tanh \zeta } となる[ 注 20] 。よって、
cosh ζ = 1 1 − tanh 2 ζ = 1 1 − ( v / c ) 2 , {\displaystyle \cosh \zeta ={\frac {1}{\sqrt {1-\tanh ^{2}\zeta }}}={\frac {1}{\sqrt {1-(v/c)^{2}}}},} sinh ζ = tanh ζ 1 − tanh 2 ζ = ( v / c ) 1 − ( v / c ) 2 {\displaystyle \sinh \zeta ={\frac {\tanh \zeta }{\sqrt {1-\tanh ^{2}\zeta }}}={\frac {(v/c)}{\sqrt {1-(v/c)^{2}}}}} である。そこでローレンツ因子 γ を
と定義すると、以下が導かれる:
相対速度を用いたローレンツ変換の表示 ― 観測者Aから見た観測者Bの相対速度をv とするとき、必要なら空間方向の座標軸を回転させる事で、ローレンツ変換は
と書ける。
我々は(L4) 式やそれと同値な(L3) 式を導くとき、空間方向の座標変換をおこなった。これは別の見方をすると、ローレンツ変換から空間方向の回転成分を取り除いたものが(L3) 式や(L4) 式であるということである。
(L3) 式や(L4) 式のように書けるローレンツ変換、すなわち空間方向に回転しないローレンツ変換の事をローレンツ・ブースト と呼ぶ。
ローレンツ変換の式(L4) 式において、v /c ≈ 0 (0に近似) とすると、(L4) 式は、
( c t ′ x ′ y ′ z ′ ) = ( c t x − v t y z ) {\displaystyle \left({\begin{array}{c}ct'\\x'\\y'\\z'\end{array}}\right)=\left({\begin{array}{c}ct\\x-vt\\y\\z\end{array}}\right)} となり、ガリレイ変換に一致する。すなわち、「ニュートン力学近似」とは、慣性座標系間の相対速度v が光速c と比べて十分小さい場合の理論であるということが言える。
このことは、ニュートン力学 のガリレイの相対性原理(ガリレイ変換 不変性)が、特殊相対性理論において、より一般的な原理(ローレンツ変換不変性)に置き換えられたことを示唆している。低速の極限( v / c → 0 ) {\displaystyle (v/c\to 0)} において特殊相対性原理はガリレイの相対性原理に帰着する。特殊相対性理論の文脈では、相対性原理は以下のように再定式化される:
全ての物理法則はローレンツ変換に対して不変でなければならない。[ 32]
本節では光速を超えずに移動する観測者A の感じる時間の長さ(観測者の固有時間 )s が、A の世界線 の(ミンコフスキー計量で測った)「長さ」に一致することを示す。
固有時間について述べる前に、まず慣性系から見た時間についての公式を与える。
x→ を世界点とし、(e → 0 ,e → 1 ,e → 2 ,e → 3 ) を原点における慣性座標系とする。このとき、以下が成立する:
慣性座標系(e → 0 ,e → 1 ,e → 2 ,e → 3 ) におけるx→ の起こる時刻はη (x → ,e → 0 ) である。
ただしここでいう「時間の長さ」はc 秒を1単位として数えた時間である。秒を単位とした時間の長さの場合は右辺をc で割る必要がある。
実際、(e → 0 ,e → 1 ,e → 2 ,e → 3 ) における成分表示を(ct ,x ,y ,z ) とすると、x→ の起こる時刻はx→ を時間軸方向へ射影 したものに一致するが、x→ を時間軸方向へ射影した値はη (x → ,e → 0 ) である。
本節では以下を示す:時間的もしくは光的な4元ベクトルu→ に沿って原点からu→ の終点まで直線的に動く観測者の固有時間s はu→ のミンコフスキー・ノルム‖ u → ‖ = η ( u → , u → ) {\displaystyle \|{\vec {u}}\|={\sqrt {\eta ({\vec {u}},{\vec {u}})}}} に一致する。
なお、u→ が時間的もしくは光的な4元ベクトルであることからη (u → ,u → ) > 0 であるので、上式の平方根は意味を持つ。
ただしここでいう「時間の長さ」はc 秒を1単位として数えた時間である。秒を単位とした時間の長さはτ =s /c である。
上の事実を示すため、O からu→ に沿って移動する観測者を考えると、この観測者の慣性座標系は、e → 0 =u → / ||u → || を時間方向の単位(4元)ベクトルとする正規直交基底(e → 0 ,e → 1 ,e → 2 ,e → 3 ) により表せる。この座標系に前述の公式を適用すれば、この座標系で観測者が原点からu→ の終点まで世界線を移動するのにかかる固有時間は
となり、最初の公式が示された。
上では観測者が原点を通る世界線に沿って移動する場合について述べたが、原点を通らない世界線に関しても、観測者が上をu→ からw→ まで直線的に動く間に||u → -w → || の固有時間が流れる事を同様の議論により証明できる。
本節では光速を超えずに移動する観測者A の世界線C が曲線である場合に対してA の固有時間を求める方法を述べる。
観測者A の時空間上の位置x→ が実数r によってパラメトライズされてx → =x → (r ) と書けているとすると、観測者がx → (r 0 ) からx → (r 0 + Δr ) まで移動する間に、
Δ s = ‖ x → ( r 0 + Δ r ) − x → ( r 0 ) ‖ = ‖ Δ x → Δ r ‖ Δ r {\displaystyle \Delta s=\|{\vec {x}}(r_{0}+\Delta r)-{\vec {x}}(r_{0})\|=\left\|{\frac {\Delta {\vec {x}}}{\Delta r}}\right\|\Delta r} の固有時間が流れることになる。したがって観測者A がC に沿って動いた際に流れる固有時間s は以下のように求まる:
これはユークリッド空間において曲線の長さを求める弧長積分 のミンコフスキー空間版であるので、上の公式は、観測者A の固有時間がA の描く世界線C の「長さ」に一致することを意味している。
次に上で示した式を慣性座標で表す。A とは別の観測者B が慣性運動しており、B の慣性座標系(ct ,x ,y ,z ) におけるA の位置x → (r ) が
x → (r ) = (ct (r ),x (r ),y (r ),z (r ))と書けていたとすると、以下が言える:
以上の議論では変数r で世界線C をパラメトライズしたが、物理学的に自然な値である秒を単位とした固有時τ そのものを使って、x → =x → (τ ) とパラメトライズするのが一般的である。このようにパラメトライズしたとき、質点x→ の4元速度 (英語版 ) u→ と4元加速度 (英語版 ) a→ を以下のように定義する:
u → := d x → d τ {\displaystyle {\vec {u}}:={\frac {\mathrm {d} {\vec {x}}}{\mathrm {d} \tau }}} 、a → := d 2 x → d τ 2 . {\displaystyle {\vec {a}}:={\frac {\mathrm {d} ^{2}{\vec {x}}}{\mathrm {d} \tau ^{2}}}.} すなわち、x→ のミンコフスキー空間上の位置の変化率を固有時間τ で測ったものが4元速度で、4元速度の変化率をτ で測ったものが4元加速度である。
4元速度のミンコフスキー・ノルムの2乗(‖ u → ‖ 2 = η ( u → , u → ) {\displaystyle \|{\vec {u}}\|^{2}=\eta ({\vec {u}},{\vec {u}})} )は、d s 2 = η ( d x → , d x → ) {\displaystyle \mathrm {d} s^{2}=\eta (\mathrm {d} {\vec {x}},\mathrm {d} {\vec {x}})} およびd s = c d τ {\displaystyle \mathrm {d} s=c\,\mathrm {d} \tau } の関係から、以下のように常に一定値c 2 {\displaystyle c^{2}} となる。 :η ( u → , u → ) = η ( d x → d τ , d x → d τ ) = η ( d x → , d x → ) d τ 2 = d s 2 d τ 2 = c 2 d τ 2 d τ 2 = c 2 {\displaystyle \eta ({\vec {u}},{\vec {u}})=\eta \left({\frac {\mathrm {d} {\vec {x}}}{\mathrm {d} \tau }},{\frac {\mathrm {d} {\vec {x}}}{\mathrm {d} \tau }}\right)={\frac {\eta (\mathrm {d} {\vec {x}},\mathrm {d} {\vec {x}})}{\mathrm {d} \tau ^{2}}}={\frac {\mathrm {d} s^{2}}{\mathrm {d} \tau ^{2}}}={\frac {c^{2}\mathrm {d} \tau ^{2}}{\mathrm {d} \tau ^{2}}}=c^{2}} したがって、4元速度はどの慣性系から見ても時間的な4元ベクトルであり、そのミンコフスキー・ノルムは常にc {\displaystyle c} である。この事実は、ユークリッド空間の曲線を弧長で微分したときの長さが1になることと対応している。長さが1でなくc なのは時間の単位がc 秒でなく1秒だからである。
以上の事から4元速度のミンコフスキー・ノルムの2乗が定数c 2 なので、これを微分する事で
である事がわかる。すなわち4元速度と4元加速度は「直交」している[ 33] 。
変分法を用いる事で、以下の事実を示せる:ミンコフスキー空間上の2つの世界点x→ , y→ を結ぶ世界線(で光速度未満のもの)のうち、最も固有時間が長くなるのは、x→ とy→ を直線的に結ぶ世界線である。
x→ からy→ へと直線的に動く観測者は慣性系にいることになるので、これは慣性運動している場合が最も固有時間が長くなる事を意味する。
固有時間が世界線の「長さ」であった事に着目すると、上述した事実は、ユークリッド空間上の二点を結ぶ最短線が直線であることに対応している事がわかる。なお、ユークリッド空間では「最短」であったはずの直線がミンコフスキー空間上では「最大」に変わっているのは、ミンコフスキーノルムの2乗(ct )2 −x 2 −y 2 −z 2 の空間部分がユークリッドノルムの2乗x 2 +y 2 +z 2 とは符号が反対である事に起因する。
ニュートン力学では、3次元空間のガリレイ変換に対して不変になるように理論が構築されている。それに対し特殊相対性理論では、4次元時空間のローレンツ変換に対して不変になるように理論を構築する必要があるので、ニュートン力学の概念をそのまま用いることはできない。本節では、ニュートン力学の諸概念を「4次元化」し、それがローレンツ変換(と平行移動)に対して不変になることを示すことで特殊相対性理論における力学を構築する。
以下、記法を簡単にするため、4元ベクトルの成分を
( x 0 , x 1 , x 2 , x 3 ) := ( c t , x , y , z ) {\displaystyle (x^{0},x^{1},x^{2},x^{3}):=(ct,x,y,z)}
などと書くことにする。
光速を超えないで運動する質点x→ の世界線をx → =x → (τ ) と秒を単位とした固有時τ でパラメトライズする。このとき、質点x→ の4元運動量 を
p → := m d x → d τ {\displaystyle {\vec {p}}:=m{\frac {\mathrm {d} {\vec {x}}}{\mathrm {d} \tau }}} と定義する。ここでm は質点x→ の慣性座標における質量(静止質量 と呼ぶ)である。すなわち、4元運動量は、4元速度に静止質量を掛けたものである。
4元運動量の物理学的意味を見るため、慣性座標系(x 0 ,x 1 ,x 2 ,x 3 ) を固定し、p→ をこの座標系に関してp → = (p 0 ,p 1 ,p 2 ,p 3 ) と成分表示する。
i = 1, 2, 3 に対し、4元運動量の定義より、
p i = m d x i d τ = m d x i / d t d τ / d t = m v i 1 − ( v / c ) 2 {\displaystyle p^{i}=m{\frac {\mathrm {d} x^{i}}{\mathrm {d} \tau }}={\frac {m\mathrm {d} x^{i}/\mathrm {d} t}{\mathrm {d} \tau /\mathrm {d} t}}={\frac {mv^{i}}{\sqrt {1-(v/c)^{2}}}}} である。ここでv = (v 1 ,v 2 ,v 3 ) はこの慣性座標系における質点の速度ベクトルであり、v = |v | である。
v /c → 0 の極限においてpi はmv i に漸近するので、4元運動量の空間部分(p 1 ,p 2 ,p 3 ) はニュートン力学の運動量(mv 1 ,mv 2 ,mv 3 ) をローレンツ変換で不変にしたものであるとみなす事ができる。
この空間成分p = γ m v {\displaystyle {\boldsymbol {p}}=\gamma m{\boldsymbol {v}}} は、ニュートン力学の運動量m v {\displaystyle m{\boldsymbol {v}}} とは異なり、速度が光速に近づくとローレンツ因子γ {\displaystyle \gamma } により無限に増大する。現代の物理学では質量を不変量m {\displaystyle m} (静止質量)として扱い、運動量そのものの定義がm v {\displaystyle m{\boldsymbol {v}}} からγ m v {\displaystyle \gamma m{\boldsymbol {v}}} へと修正されると解釈するのが一般的である[ 注 21] 。
4元運動量の時間成分p 0 にc を掛けたものをテイラー展開 すると、
c p 0 = c m d x 0 d τ = m d x 0 / d t d τ / d t = m c 2 1 − ( v / c ) 2 = m c 2 + m v 2 2 + ⋯ {\displaystyle {\begin{aligned}cp^{0}&=cm{\frac {\mathrm {d} x^{0}}{\mathrm {d} \tau }}={\frac {m\mathrm {d} x^{0}/\mathrm {d} t}{\mathrm {d} \tau /\mathrm {d} t}}\\&={\frac {mc^{2}}{\sqrt {1-(v/c)^{2}}}}=mc^{2}+{\frac {mv^{2}}{2}}+\cdots \end{aligned}}} である。
第二項はニュートン力学における運動エネルギーであるのでcp 0 はエネルギーに相当していると考えられる。
従って第一項の
もエネルギーを表していると解釈できる。この値は質点が例え慣性系に対して静止していてv = 0 であっても持つエネルギーであることから、この値を質点の静止質量エネルギー と呼ぶ。
質量m を持つこととエネルギーmc ² を持つことは等価であり、質量欠損 や核反応 ・対消滅 に伴うエネルギー放出・吸収から確かめられている。
4元運動量p → {\displaystyle {\vec {p}}} のミンコフスキー・ノルムは、4元速度のノルムが‖ u → ‖ = c {\displaystyle \|{\vec {u}}\|=c} であることから、
| p → | = | m u → | = m | u → | = m c {\displaystyle |{\vec {p}}|=|m{\vec {u}}|=m|{\vec {u}}|=mc} である。したがって、その2乗はη ( p → , p → ) = ( m c ) 2 {\displaystyle \eta ({\vec {p}},{\vec {p}})=(mc)^{2}} というローレンツ不変量になる。
一方、慣性座標系を1つ固定して4元運動量を成分表示p → = ( p 0 , p ) {\displaystyle {\vec {p}}=(p^{0},{\boldsymbol {p}})} とすると、前に示したように、エネルギーE =cp 0 、運動量p {\displaystyle {\boldsymbol {p}}} と書ける。4元運動量のノルムの2乗はη ( p → , p → ) = ( p 0 ) 2 − | p | 2 {\displaystyle \eta ({\vec {p}},{\vec {p}})=(p^{0})^{2}-|{\boldsymbol {p}}|^{2}} である。先に示した不変量η ( p → , p → ) = ( m c ) 2 {\displaystyle \eta ({\vec {p}},{\vec {p}})=(mc)^{2}} にこの成分表示を代入すると、:( m c ) 2 = ( E / c ) 2 − | p | 2 {\displaystyle (mc)^{2}=(E/c)^{2}-|{\boldsymbol {p}}|^{2}} となる。この両辺にc 4 {\displaystyle c^{4}} を乗じることで、エネルギー、運動量、静止質量の間の有名な関係式(エネルギー・運動量関係)が得られる。:( m c 2 ) 2 = E 2 − ( c p ) 2 {\displaystyle (mc^{2})^{2}=E^{2}-(cp)^{2}} すなわち、E 2 = ( c p ) 2 + ( m c 2 ) 2 {\displaystyle E^{2}=(cp)^{2}+(mc^{2})^{2}} である。左辺は慣性系によらない不変量( m c 2 ) 2 {\displaystyle (mc^{2})^{2}} であるため、E 2 − (cp )2 は慣性系によらず一定値(mc 2 )2 になることを意味する。
p ≪mc であれば上の式は
E = ( m c 2 ) 2 + ( c p ) 2 = m c 2 + p 2 2 m + ⋯ {\displaystyle E={\sqrt {(mc^{2})^{2}+(cp)^{2}}}=mc^{2}+{\frac {p^{2}}{2m}}+\cdots } となり[ 34] 、静止質量エネルギーmc 2 を無視すれば、p 2 / 2m が質点の運動エネルギーに相当するというニュートン力学の式に対応していることがわかる。
正の質量を持った質点は光速度以上になれない[ 編集 ] 光速で移動する有限のエネルギーを持った粒子を考える。この時、mγc ² のγ が無限大に発散してしまうので、m = 0 でなければならない。この逆も成立するため、質量を持たずに有限のエネルギーを持つ物質は常に光速で走り続けねばならず、また光速で移動するエネルギーを持つ物質はすべて質量が0であることが分かる。
特殊相対性理論以前の電磁気学において、J.J.トムソン やワルター・カウフマン (英語版 ) によって電子の質量の速さ依存性が指摘されていた。それを説明する理論としてマックス・アブラハム は、電子の慣性質量の起源を全て電磁場に求めるという電磁質量概念 (Electromagnetic mass ) を提唱したが、電子以外の物質の構成要素に対して一般化することができなかった[ 注 22] 。
一方、特殊相対性理論はその物質の質量の速さ依存性についての一般的な説明と慣性質量とエネルギーに関する普遍的な関係を与える[ 注 23] 。
すでに運動量の概念を4元ベクトル化したので、力の概念を4元ベクトル化した4元力 f→ が定義できれば、 ニュートンによる質点の運動方程式f = dp / dt をローレンツ変換に不変にした特殊相対性理論の運動方程式(ミンコフスキー力)
f → = d p → d τ {\displaystyle {\vec {f}}={\frac {\mathrm {d} {\vec {p}}}{\mathrm {d} \tau }}} が定式化できる。ここで微分は座標時間t {\displaystyle t} ではなく、固有時間τ {\displaystyle \tau } で行われる。
現在知られている4種類の力のうち、電磁気力、強い力 、弱い力 の3つは4元力として表現可能な事が知られている[ 37] 。このうち電磁気力を4元力として表現する方法は後の節で述べる。
一方、重力は特殊相対性理論の範囲で4元ベクトル化しようとしてもローレンツ変換に対して不変にならないためうまくいかない[ 38] 。重力を扱うには一般相対性理論が必要となる。
特殊相対性理論から導かれる帰結として、たとえば、主に以下の事項を挙げることができる。項目ごとの詳細は後述する。
ある観測者(A, Bとする)が有限の速度差をもって互いに運動(相対運動)するとき、一方の観測者Aから観測したもう一方の観測者Bの時計の時刻の遅れが生じる。このずれの大きさは相対運動の速さによる(#時間(時刻の隔たり)の伸び )。この観測のずれはまさに「相対的」であり、もう一方の観測者Bから観測者Aの持つ時計を観測しても遅れを認めることができる。観測者AとBは等価であり、双方が双方の時計に(自身の持つ時計と比べて)遅れが生じていると観測できる。(「観測者Aと観測者Bのどちらかの時計が誤りである」あるいは「観測者Aでも観測者Bでもない”絶対時間”を指す正しい時計が存在する」、といった考え方を特殊相対性理論は放棄している) 相対運動する物体どうしは、互いに相手からは縮んで見える(#ローレンツ収縮 )。これも上記の考え方に類似であり、どちらかの観測者のモノサシが誤っていたり、”絶対空間”にある正しいモノサシは存在したりはしない。 エネルギーと質量は可換であり、観測者・観測対象の運動状態によって(座標変換によって)双方は相互に変換される。 速度の合成則は非線形接続である。たとえば、観測者に対して光速の0.6倍で動く宇宙船から、(宇宙船からみて)光速の0.6倍で物体を進行方向に射出しても、観測者から見た宇宙船からの射出部隊の速度は光速の1.2倍にはならない。(#速度の合成則 ) 運動する物体[ 注 24] は高速になるほど加速しづらくなり、光速に到達することはない。 次の事柄は、特殊相対性理論の前提あるいは理論展開(#特殊相対性理論の基礎 )するところそのものである。特殊相対論によって座標変換に関して対称な簡潔な数式系にまとめられることができたこと、さらに、後に実験事実として得た諸結果が特殊相対性理論によく整合したことから、物理の基本原理として、これらはより支持されるようになった(#特殊相対性理論の実験的検証 )。
光の速度は観測者の移動の影響を受けず一定値である。 慣性系相互の座標変換において、物理法則を普遍に保つ変換則はローレンツ変換である。 マクスウェル方程式は修正する必要はない。 ローレンツ収縮。図では時間ct をw で表している。慣性系(x',w') に固有長さがl の棒(x' 軸の濃い紫)があり、この棒の時空間上の軌跡が薄紫である。それを別の慣性系(x,w) で計ると長さがl / γ に縮んで見える。ここでγ はローレンツ因子1 / √ 1 − (v /c )2 である。慣性系(x',w') と慣性系(x,w) とでは棒の測っている箇所が違うことに注意。図の双曲線は原点からの世界距離の2乗w 2 −x 2 が−l 2 になる箇所。 以下では話を簡単にするため時間1次元+空間1次元の計2次元の場合について述べる。
ある慣性系(ct ′,x ′) において静止している剛体について、この慣性系(ct ′,x ′) で測った剛体の長さをこの剛体の固有長さ と呼ぶ。
今、固有長さl の棒が慣性系(ct ′,x ′) に対して静止しており、これを別の慣性系(ct ,x ) から眺めたとする。話を簡単にするため、2つの慣性系の原点はいずれも棒の1つの端点O に一致しているものとする。
棒は慣性系(ct ′,x ′) に対して静止しているので、棒の他方の端点が描く世界線C は(ct ′,l ) とt′ でパラメトライズできる。
慣性系(ct ,x ) における現在(0,x ) と世界線C との交わりはローレンツ変換により
( c t ′ l ) = γ ( c ⋅ 0 + x ⋅ ( v / c ) x − v ⋅ 0 ) {\displaystyle {\begin{pmatrix}ct'\\l\\\end{pmatrix}}=\gamma {\begin{pmatrix}c\cdot 0+x\cdot (v/c)\\x-v\cdot 0\\\end{pmatrix}}} なので、棒の長さは
となる。ここでγ > 1 はローレンツ因子1/√ 1 − (v /c )2 である。
これにしたがうと、棒に対して長さ方向に運動している座標系からみると、棒の長さは1/γ 倍に縮んだかのように見える。この現象をローレンツ収縮 [ 39] [ 40] もしくはフィッツジェラルド=ローレンツ収縮 [ 41] [ 42] という。
地上で(地面に対して)静止している観測者からみて、高速で飛んでいるロケットは(地上に)停まっているときよりも短く見える(進行方向に収縮している)。
地上から上空へ向かうロケットを地上から観測したとき、ロケットの後端に設置した時計は、ロケットの先端に設置した時計よりずれが大きい。このとき、ロケットに乗る観測者からすれば、ロケットの速度での運動座標系において、ロケットの後端と先端の時計が刻む時刻は同時に見える。
なお、実際にはロケットが観測者にどのように見えるかという点については、特殊相対性理論による時刻・座標のずれに加えて、ロケット各部からの光の到達時刻を加味する必要がある(これを考慮に入れた場合、さらに歪んだ見え方となりうる)
ローレンツ収縮は、アインシュタインが特殊相対性理論を提案する以前に、ローレンツとフィッツジェラルドが独立に提案したものである。彼らの提案は、数式上は特殊相対性理論のそれと同一であるが、彼らの理論はエーテル仮説を前提としており、物体は「エーテルの風」を受けて3次元空間内で実際に縮む [ 43] とするものであった。すなわち、あくまでも彼らは「エーテルが静止している絶対空間がある」という考えのもとに立っていた。
それに対して、特殊相対性理論では、ローレンツ収縮を4次元時空間の各観測者ごとの座標系において解釈したものであり、絶対空間や絶対時間の存在を前提としない。前述のように慣性系によって測っている場所が違う 事が収縮の起こる原因である。
運動する観測者 A があり、A とは別の観測者 B が慣性運動し、A 側の座標系(ct, x, y, z ) にて B の位置が、
x → (τ ) = (ct (τ ),x (τ ),y (τ ),z (τ ))と書けるとき、
d s 2 = ( c d t ) 2 − d x 2 − d y 2 − d z 2 {\displaystyle \mathrm {d} s^{2}=(c\mathrm {d} t)^{2}-\mathrm {d} x^{2}-\mathrm {d} y^{2}-\mathrm {d} z^{2}} というローレンツ変換について不変な量s をとり、A側の固有時刻 をτ =s /c とする。
c 2 ( d τ d t ) 2 = ( d s d t ) 2 = c 2 − ( d x d t ) 2 − ( d y d t ) 2 − ( d z d t ) 2 = c 2 − v 2 {\displaystyle c^{2}\left({\frac {\mathrm {d} \tau }{\mathrm {d} t}}\right)^{2}=\left({\frac {\mathrm {d} s}{\mathrm {d} t}}\right)^{2}=c^{2}-\left({\frac {\mathrm {d} x}{\mathrm {d} t}}\right)^{2}-\left({\frac {\mathrm {d} y}{\mathrm {d} t}}\right)^{2}-\left({\frac {\mathrm {d} z}{\mathrm {d} t}}\right)^{2}=c^{2}-v^{2}} であることより
である。右辺はローレンツ因子γ の逆数である。これを観測者 A の世界線 C に沿って積分すると
により、A 側の固有時間T が得られる。ここでv (t ) は時刻t における A と B の相対速度である。
v <c ゆえ、積分内は常に1未満であり、慣性系B側の時間T′ との関係は次式となる:
これはすなわち、ある慣性系でみたときの時間は固有時間よりも長い 事を意味する。
特に観測者 A も慣性運動しているときは、相対速度v は常に一定であり、次式となる:
観測者A 、B が慣性運動しており、さらに質点C が運動しているとする(慣性運動とは限らない)。
観測者A の座標系を(ct ,x ,y ,z ) とし、観測者B の座標系を(ct ′,x ′,y ′,z ′) とし、A から見たB の相対速度の大きさをV とし、
γ = 1 / 1 − ( V / c ) 2 {\displaystyle \gamma =1/{\sqrt {1-(V/c)^{2}}}} をローレンツ因子とする。
必要ならミンコフスキー空間の原点を取り替えることでC は原点を通っているとしてよく、さらにC の運動方向はy 軸、z 軸と直交しているとし、y' 軸、z' 軸がy 軸、z 軸と一致しているとしても一般性を失わない。
観測者A 、B から見たC の速度をそれぞれ(v x ,v y ,v z ) 、(v′ x ,v′ y ,v′ z ) とするとき、B の座標系からA の座標系への速度変換則は、ローレンツ変換の(L4) 式より以下のようになる:
( v x ′ , v y ′ , v z ′ ) = c ( d x ′ , d y ′ , d z ′ ) c d t ′ = c ( γ ( d x − V d t ) , d y , d z ) γ ( c d t + ( V / c ) d x ) = ( v x − V , v y / γ , v z / γ ) 1 + V v x / c 2 . {\displaystyle {\begin{aligned}(v'_{x},v'_{y},v'_{z})&={\frac {c(\mathrm {d} x',\mathrm {d} y',\mathrm {d} z')}{c\mathrm {d} t'}}\\&={\frac {c(\gamma (\mathrm {d} x-V\mathrm {d} t),\mathrm {d} y,\mathrm {d} z)}{\gamma (c\mathrm {d} t+(V/c)\mathrm {d} x)}}\\&={\frac {(v_{x}-V,v_{y}/\gamma ,v_{z}/\gamma )}{1+Vv_{x}/c^{2}}}.\end{aligned}}} 本節では、質点の速度が光速を越えない限り、特殊相対性理論においても因果律が成り立つことを示す。以下、特に断りがない限り、質点、観測者の双方とも光速度以下であるものとする。
x→ , y→ をミンコフスキー空間上の2つの世界点とする。y → −x → が未来の光円錐の内部にあるとき、x→ はy→ の因果的過去 (causally precede) といい、x → <y → と書く。同様にy → −x → が未来の光円錐の内部もしくは未来の光円錐上にあるとき、x→ はy→ の年代的過去 (chronologically precede) といい、x → ≦y → と書く。
因果的過去は以下のように特長づけられる:
ミンコフスキー空間上の点x→ にある質点が光速未満(resp. 以下)でy→ に到達できる ⇔x → <y → (resp.x → ≦y → )。
よって特に以下が成立する:
従って「≦」は数学的な(半)順序 の公理を満たす。
以下の事実は、質点の速度が光速を越えない限り座標系の取り替えで因果律が破綻しない事を意味している:
x → ≦y → かつx→ ≠y→ ⇔全ての慣性座標系で 、y→ はx→ より時間的に後に起こる。
実際、どのような慣性座標系を選んでも、その時間軸e → 0 は未来の光円錐内または未来の光円錐上にあるので、x→ ≦y→ であれば、x→ からy→ までに流れる時間η (y → -x → ,e → 0 ) は正である。
一方、x→ ≦y→ でもy→ ≦x→ でもないとき、すなわちy → −x → が空間的なときはこのような関係は成り立たない。y → −x → が空間的なとき、以下の3種類の慣性座標系が存在する:
y→ がx→ より後に起こるy→ とx→ が同時に起こるx→ がy→ より先に起こるすなわち空間的な関係にある2点x→ 、y→ の時間的な順序関係は慣性系に依存してしまう。これはニュートン力学的な直観に反するが、x→ とy→ には因果関係がないので、どちらが先に起ころうとも因果律が破綻することはない[ 44] 。
特殊相対性理論によれば、慣性系Aから慣性系Bを見ると、Bの時計はAの時計より遅れて進むように観測される。同時に、特殊相対性原理からAとBは対等であるため、慣性系Bから慣性系Aを見ても、Aの時計はBの時計より遅れて進むように観測される。
一見すると矛盾のように思えるため、これは「時計のパラドックス」と呼ばれることがある[ 45] 。しかし、2つの慣性系がすれ違った後、再び出会うことはないため、どちらの時計が「本当に」遅れたかを直接比較することはできず、矛盾は生じていない。
この思考実験を「パラドックス」として成立させるためには、2人が再会する必要がある。これが一般に「双子のパラドックス」と呼ばれる問題である。一組の双子がいて、弟は地球(慣性系とみなす)に留まり、兄はロケットに乗って高速で宇宙旅行に出発し、どこかでUターンして加速・減速を行い、再び地球の弟のもとに帰ってきたとする。
弟からみれば、高速で運動していた兄の時計は遅れるはずである。一方、兄からみれば、相対的に運動していたのは弟(地球)であり、弟の時計が遅れるはずである。2人が再会した時、どちらが年を取っているのか?
結論からいえば、特殊相対性理論(および加速度運動の扱い)から示されるのは、ロケットに乗った兄より慣性運動を続けた弟の方が時計が進んでいる(=年を取っている)という事である[ 46] 。
なぜならミンコフスキー空間上で、兄がロケットで飛び立ったときの世界点をx→ とし、兄が再び弟に再会したときの世界点をy→ とすると、x→ とy→ を結ぶ世界線のうち最も固有時間が長くなるのは慣性運動する世界線(弟の世界線)であることをすでに示したからである。従って慣性運動していた弟は、加速・減速・Uターンという非慣性運動(世界線が曲がっている)を経験した兄より多くの固有時間を費やした事になるのである[ 46] 。
では逆に弟のほうが兄より若くなったとする主張のどこが間違っていたのかというと、我々が時間の縮みの公式を導いたとき、慣性系である事を仮定していたのであるが、兄の座標系はロケットが行きと帰りで向きを変える際(Uターン時)に加速度運動しており、往路と復路で異なる慣性系に乗り換えている。この乗り換え(非慣性運動)の際に、兄にとっての「同時刻」の基準が大きく変化するため、弟の座標系(単一の慣性系)に対して単純に時間の縮みの公式を往復で適用したのが間違いだったのである[ 46] 。
今、長さl のハシゴ と奥行きL <l のガレージがあるとし、ハシゴは高速でガレージに近づいてきたとする。ガレージが静止して見える慣性系から見ると、ハシゴがローレンツ収縮するので、ハシゴはガレージに入ってしまう。一方、ハシゴが静止して見える慣性系からみると、逆にガレージの方がローレンツ収縮してしまうので、ハシゴはガレージに入らないはずである。正しいのはどちらであろうか。
結論からいうと、どちらも正しく、ガレージの系から見た場合は、ハシゴはガレージに入るように見え、ハシゴの系から見るとハシゴはガレージに入らないように見える。すなわち、ハシゴの前端と後端に関する事象を区別して述べれば、ガレージの静止系ではハシゴの後端がガレージに入りきった後 、ハシゴの前端がガレージの裏の壁にぶつかるのに対し、ハシゴの静止系ではハシゴがガレージに入り切らず、ハシゴの後端がガレージに入る前 にハシゴの前端がガレージの裏壁にぶつかる[ 47] 。ハシゴの前端がガレージの裏壁にぶつかる事象とハシゴの後端がガレージに入りきる事象には因果関係がないので、どちらが先に起こるのかは慣性系によって変化するのである。
先に進む前に、特殊相対性理論で頻繁に用いられるテンソル代数の知識について述べる。
特殊相対性理論では、
∑ μ a μ b μ {\displaystyle \sum _{\mu }a^{\mu }b_{\mu }} のように上つきと下つきで同じ添え字(この場合はμ )が使われているときは、Σ 記号を省略し、
a μ b μ {\displaystyle a^{\mu }b_{\mu }} と書き表す慣用的な記法が用いられることが多い。この記法をアインシュタインの縮約記法 という。
この縮約記法は行列の積や3項以上の場合にも同様に用いられ、例えば
∑ κ , τ a μ κ b κ τ c τ ν {\displaystyle \sum _{\kappa ,\tau }a^{\mu }{}_{\kappa }b^{\kappa }{}_{\tau }c^{\tau }{}_{\nu }} は
a μ κ b κ τ c τ ν {\displaystyle a^{\mu }{}_{\kappa }b^{\kappa }{}_{\tau }c^{\tau }{}_{\nu }} と略す。
一方、たとえ2箇所の添え字が共通していても、
∑ μ a μ b μ {\displaystyle \sum _{\mu }a_{\mu }b_{\mu }} 、∑ ν c ν d ν {\displaystyle \sum _{\nu }c^{\nu }d^{\nu }} のように添え字が両方下つき、もしくは両方上つきの場合はΣ を省略しない。
(V ,η ) を4次元ミンコフスキー空間とし、e → 0 ,e → 1 ,e → 2 ,e → 3 を(V ,η ) 上の(正規直交とは限らない)基底とする。このとき、以下の性質を満たすV の基底e → 0 ,e → 1 ,e → 2 ,e → 3 が一意に存在する事が知られており、この基底をe → 0 ,e → 1 ,e → 2 ,e → 3 の双対基底 という[ 注 25] :
任意のμ, ν = 0, ..., 3 に対し、η ( e → μ , e → ν ) = δ μ ν . {\displaystyle \eta ({\vec {e}}^{\mu },{\vec {e}}_{\nu })=\delta ^{\mu }{}_{\nu }.} ここでδ μ ν {\displaystyle \delta ^{\mu }{}_{\nu }} はクロネッカーのデルタ である。
正規直交基底の場合は双対基底は非常に簡単に書くことができる:
( e → 0 , e → 1 , e → 2 , e → 3 ) = ( e → 0 , − e → 1 , − e → 2 , − e → 3 ) . {\displaystyle ({\vec {e}}^{0},{\vec {e}}^{1},{\vec {e}}^{2},{\vec {e}}^{3})=({\vec {e}}_{0},-{\vec {e}}_{1},-{\vec {e}}_{2},-{\vec {e}}_{3}).} 上でも分かるように、双対基底は元の基底と空間方向の向きが反対である。
本項では正規直交の場合にしか双対基底の概念を用いないが、一般相対性理論を定式化する際には一般の基底に対する相対基底が必要となる為、以下基底は正規直交とは限らない場合について述べる。
双対基底はミンコフスキー計量の成分表示を使って具体的に求めることができる。
η μ ν = η ( e → μ , e → ν ) {\displaystyle \eta _{\mu \nu }=\eta ({\vec {e}}_{\mu },{\vec {e}}_{\nu })} とするとき、(η μν )μν の逆行列を((η −1 )μν )μν とすれば、
e → μ = ( η − 1 ) μ ξ e → ξ {\displaystyle {\vec {e}}^{\mu }=(\eta ^{-1})^{\mu \xi }{\vec {e}}_{\xi }} である。実際、
η ( e → μ , e → ν ) = ( η − 1 ) μ ξ η ( e → ξ , e → ν ) = ( η − 1 ) μ ξ η ξ ν = δ μ ν {\displaystyle \eta ({\vec {e}}^{\mu },{\vec {e}}_{\nu })=(\eta ^{-1})^{\mu \xi }\eta ({\vec {e}}_{\xi },{\vec {e}}_{\nu })=(\eta ^{-1})^{\mu \xi }\eta _{\xi \nu }=\delta ^{\mu }{}_{\nu }} である。
双対基底の定義から、次が成立する:
e → 0 ,e → 1 ,e → 2 ,e → 3 の双対基底の双対基底はe → 0 ,e → 1 ,e → 2 ,e → 3 自身である。
以下の議論では、「通常の」基底e → 0 ,e → 1 ,e → 2 ,e → 3 を一組固定し、e → 0 ,e → 1 ,e → 2 ,e → 3 をその双対基底とする。しかし上の定理でもわかるように、どちらの基底を「通常の」基底とみなし、どちらを双対基底とみなすのかは任意である。本項では、空間方向が右手系のものを通常の基底とみなし、左手系のものをその双対基底とみなすことにする。
V の元a→ を基底e → 0 ,e → 1 ,e → 2 ,e → 3 で表す場合、a→ の各成分の添え字を
a → = a μ e → μ {\displaystyle {\vec {a}}=a^{\mu }{\vec {e}}_{\mu }} のように上つきに書く(アインシュタインの縮約で表記)。一方、a→ をe → 0 ,e → 1 ,e → 2 ,e → 3 の双対基底e → 0 ,e → 1 ,e → 2 ,e → 3 を用いて表す場合、a→ の各成分の添え字を
a → = a μ e → μ {\displaystyle {\vec {a}}=a_{\mu }{\vec {e}}^{\mu }} のように下つきに書く。明らかに
a μ = η ( a → , e → μ ) , a μ = η ( a → , e → μ ) {\displaystyle a^{\mu }=\eta ({\vec {a}},{\vec {e}}^{\mu }),\quad a_{\mu }=\eta ({\vec {a}},{\vec {e}}_{\mu })} である。また正規直交基底の場合は明らかに
( a 0 , a 1 , a 2 , a 3 ) = ( a 0 , − a 1 , − a 2 , − a 3 ) {\displaystyle (a^{0},a^{1},a^{2},a^{3})=(a_{0},-a_{1},-a_{2},-a_{3})} が成立する。
V の2つの元a→ 、b→ のミンコフスキー内積をとるとき、一方を基底e → 0 ,e → 1 ,e → 2 ,e → 3 で表し、他方をその双対基底で表すと、
η ( ∑ μ a μ e → μ , ∑ ν b ν e → ν ) = a 0 b 0 + a 1 b 1 + a 2 b 2 + a 3 b 3 = a μ b μ {\displaystyle \eta \left(\sum _{\mu }a^{\mu }{\vec {e}}_{\mu },\sum _{\nu }b_{\nu }{\vec {e}}^{\nu }\right)=a^{0}b_{0}+a^{1}b_{1}+a^{2}b_{2}+a^{3}b_{3}=a^{\mu }b_{\mu }} と通常の内積のように書け、ミンコフスキー内積特有の符号の煩わしさから解放されるので便利である。
基底を一つ指定したとき、aμ は添え字μ に対し反変 、aμ は添え字μ に対し共変 であるという。これらの名称は、基底を取り替えた際の成分の変化に由来する。すなわち、ミンコフスキー空間上にもう1組の基底(e′ → 0 ,e′ → 1 ,e′ → 2 ,e′ → 3 ) を用意し、基底の間の座標変換が成分表示で
e′ → ν =e → μ Λμ ν と書けていたとすると4元ベクトルa → の反変成分a → =a ′ν e ′→ ν =a μ e → μ は、
a ′ν = (Λ−1 )ν μ a μ という関係になるので、ダッシュつきの座標系にうつるとき、基底とは反対にΛμ ν の逆行列で結ばれる。それゆえ、「反対の変化」、すなわち反変と呼ばれる。
一方、基底の変更に対する共変成分の変化を見るため、双対基底が基底の変更でどのような影響を受けるか調べる。
e ′→ ν =e → μ Γμ ν とすると、
δ μ ν = η ( e → ′ μ , e → ν ′ ) = Γ μ ξ Λ κ ν η ( e → ξ , e → κ ) {\displaystyle \delta ^{\mu }{}_{\nu }=\eta ({\vec {e}}'^{\mu },{\vec {e}}'_{\nu })=\Gamma ^{\mu }{}_{\xi }\Lambda ^{\kappa }{}_{\nu }\eta ({\vec {e}}^{\xi },{\vec {e}}_{\kappa })} = Γ μ ξ Λ κ ν δ ξ κ = Γ μ ξ Λ ξ ν {\displaystyle =\Gamma ^{\mu }{}_{\xi }\Lambda ^{\kappa }{}_{\nu }\delta ^{\xi }{}_{\kappa }=\Gamma ^{\mu }{}_{\xi }\Lambda ^{\xi }{}_{\nu }} すなわち、Γμ ν はΛμ ν の逆行列(Λ−1 )μ ν であるので、双対基底は
e ′→ ν =e → μ (Λ−1 )μ ν という変換規則に従うことがわかる。よって4元ベクトルa→ の共変成分a → =a ′ν e ′→ ν =a μ e → μ は、
a ′ν = Λν μ a μ という関係になるので、ダッシュつきの座標系にうつるとき、基底と共通の行列Λμ ν で結ばれる。それゆえ、「共通の変化」、すなわち共変と呼ばれる。
本節ではテンソルに関する基本的な知識を紹介する。ただし本節での解説はミンコフスキー空間V 上に限定したものであるので、一般の空間で成り立つとは限らない[ 注 25] 。
n を自然数とする。写像T : V n → R {\displaystyle T\colon V^{n}\to \mathbb {R} } が以下の性質(多重線形性 )を満たすとき、T をn 次のテンソル という:
V の任意の4元ベクトルa→ μ ν と任意の実数kμ ν に対し、T ( ∑ ν 1 k ν 1 1 a → ν 1 1 , … , ∑ ν n k ν n n a → ν n n ) = ∑ ν 1 , … , ν n k ν 1 1 ⋯ k ν n n T ( a → ν 1 1 , … , a → ν n n ) . {\displaystyle {\begin{aligned}&T(\sum _{\nu _{1}}k_{\nu _{1}}^{1}{\vec {a}}_{\nu _{1}}^{1},\ldots ,\sum _{\nu _{n}}k_{\nu _{n}}^{n}{\vec {a}}_{\nu _{n}}^{n})\\&=\sum _{\nu _{1},\ldots ,\nu _{n}}k_{\nu _{1}}^{1}\cdots k_{\nu _{n}}^{n}T({\vec {a}}_{\nu _{1}}^{1},\ldots ,{\vec {a}}_{\nu _{n}}^{n}).\end{aligned}}} 特殊相対性理論で重要なのは主に2次のテンソルであるので、以下2次のテンソルに話を限定するが、一般の場合も同様である。なお、2次のテンソルは数学で二次形式 と呼ばれるものと同一である。
2次のテンソルT に対し、
T ( a → , b → ) = T ( b → , a → ) {\displaystyle T({\vec {a}},{\vec {b}})=T({\vec {b}},{\vec {a}})} が全ての4元ベクトルa→ 、b→ に対して成り立つとき、T を対称テンソル という。また
T ( a → , b → ) = − T ( b → , a → ) {\displaystyle T({\vec {a}},{\vec {b}})=-T({\vec {b}},{\vec {a}})} が全ての4元ベクトルa→ 、b→ に対して成り立つとき、T を反対称テンソル という。
T をミンコフスキー空間上の2次のテンソルとし、e → 0 ,e → 1 ,e → 2 ,e → 3 をミンコフスキー空間の基底とし、e → 0 ,e → 1 ,e → 2 ,e → 3 をその双対基底とする。このとき、上述の基底や相対基底を使ってT を4通りに成分表示 する事が可能である:
T μ ν = T ( e → μ , e → ν ) , T μ ν = T ( e → μ , e → ν ) , T μ ν = T ( e → μ , e → ν ) , T μ ν = T ( e → μ , e → ν ) . {\displaystyle {\begin{aligned}T_{\mu \nu }&=T({\vec {e}}_{\mu },{\vec {e}}_{\nu }),\\T^{\mu }{}_{\nu }&=T({\vec {e}}^{\mu },{\vec {e}}_{\nu }),\\T_{\mu }{}^{\nu }&=T({\vec {e}}_{\mu },{\vec {e}}^{\nu }),\\T^{\mu \nu }&=T({\vec {e}}^{\mu },{\vec {e}}^{\nu }).\end{aligned}}} 4元ベクトルa→ ,b→ を
a → = a μ e → μ = a μ e → μ {\displaystyle {\vec {a}}=a^{\mu }{\vec {e}}_{\mu }=a_{\mu }{\vec {e}}^{\mu }} b → = b ν e → ν = b ν e → ν {\displaystyle {\vec {b}}=b^{\nu }{\vec {e}}_{\nu }=b_{\nu }{\vec {e}}^{\nu }} と成分表示する(アインシュタインの縮約で表記)と、
が成立する。
上述の4通りの成分表示において、T は上付きの添え字に対し反変 、下付きの添え字に対し共変 であるという。
4元ベクトルの場合と同様、基底を別のものに取り替えたときT の各成分は、反変の添え字に関しては基底変換行列の逆行列が、共変の添え字に関しては基底変換行列そのものが作用する。例えば
e′ → ν =e → μ Λμ ν とすると
e′ → ν =e → μ (Λ−1 )μ ν なので、ダッシュつきの基底に関する成分T ′μ ν は
T ′ μ ν = T ( e → ′ μ , e → ν ′ ) = T ( e → ξ , e → κ ) ( Λ − 1 ) ξ μ Λ κ ν = T ξ κ ( Λ − 1 ) ξ μ Λ κ ν {\displaystyle T'^{\mu }{}_{\nu }=T({\vec {e}}'^{\mu },{\vec {e}}'_{\nu })=T({\vec {e}}^{\xi },{\vec {e}}_{\kappa })(\Lambda ^{-1})_{\xi }{}^{\mu }\Lambda ^{\kappa }{}_{\nu }=T^{\xi }{}_{\kappa }(\Lambda ^{-1})_{\xi }{}^{\mu }\Lambda ^{\kappa }{}_{\nu }} と、上付きの添え字には反変、下付の添え字には共変に変化する。
ミンコフスキー計量η も二次の対称テンソルであるので、上述のように成分表示できる。
基底が正規直交であれば、ミンコフスキー計量の成分表示は非常に簡単になり、
( η μ ν ) μ ν = ( η μ ν ) μ ν = ( 1 − 1 − 1 − 1 ) , {\displaystyle (\eta _{\mu \nu })_{\mu \nu }=(\eta ^{\mu \nu })_{\mu \nu }=\left({\begin{array}{cccc}1&&&\\&-1&&\\&&-1&\\&&&-1\end{array}}\right),} ( η μ ν ) μ ν = ( η μ ν ) μ ν = ( 1 1 1 1 ) . {\displaystyle (\eta _{\mu }{}^{\nu })_{\mu \nu }=(\eta ^{\mu }{}_{\nu })_{\mu \nu }=\left({\begin{array}{cccc}1&&&\\&1&&\\&&1&\\&&&1\end{array}}\right).} のように書くことができる。
ミンコフスキー空間上の線形写像f :V →V が与えられたとき、2次のテンソルを
と定義できる。
逆にミンコフスキー空間上の2次のテンソルT が任意に与えられたとき、(T1) 式を満たす線形写像f が一意に存在する事が知られている。従って2次のテンソルと線形写像を自然に同一視できる。
2次のテンソルT に対応する線形写像は基底e → 0 ,e → 1 ,e → 2 ,e → 3 を用いると、下記のように具体的に書き表す事もできる:
a μ e → μ ↦ T ν μ a μ e → ν . {\displaystyle a^{\mu }{\vec {e}}_{\mu }\mapsto T^{\nu }{}_{\mu }a^{\mu }{\vec {e}}_{\nu }.} ミンコフスキー空間上の各世界点P にテンソルTP を割り振ったもの(すなわちミンコフスキー空間からテンソルの集合への写像P⤅ TP )をテンソル場 という。
相対性理論でテンソル場は中核に位置する概念であり、電磁場を初めとして様々なものをテンソル場として表現する。
本節では、電磁気学の基本的な概念や方程式を特殊相対性理論に合致する形に書き換える。
以下、慣性系
( x 0 , x 1 , x 2 , x 3 ) , x 0 = c t {\displaystyle (x^{0},x^{1},x^{2},x^{3}),~x^{0}=ct} を1つ固定し、この慣性系において電磁気学を記述する。詳細は省くが、本節の記述は、他の慣性系で電磁気学を記述したものとローレンツ変換で移りあう事を確認できるので、特殊相対性理論に合致している。
なお、本項では国際単位系 を用いる場合に対して記述したが、Landau, Lifshitz (3rd ed.) (1971) などガウス単位系 (英語版 ) を用いている書籍における定義とは光速度c のかかる位置が違うなどの差があるので注意が必要である[ 注 26] 。
電荷密度 ρ と電流密度 j = (jx ,jy ,j z ) を使って、4元電流密度 を、
( j 0 , j 1 , j 2 , j 3 ) := ( c ρ , j x , j y , j z ) {\displaystyle (j^{0},j^{1},j^{2},j^{3}):=(c\rho ,j_{x},j_{y},j_{z})} によって定義する。
すると電磁気学における連続の方程式
∂ ρ ∂ t + ∇ ⋅ j = 0 {\displaystyle {\frac {\partial \rho }{\partial t}}+\nabla \cdot {\boldsymbol {j}}=0} は、4元電流密度と4元勾配 (英語版 ) (4–gradient)(∂ 0 ,∂ 1 ,∂ 2 ,∂ 3 ) を用いて
∂ ν j ν = 0 {\displaystyle \partial _{\nu }j^{\nu }=0} と表現できる。ここで∂ν は∂ /∂xν の略記である。
真空の誘電率 、透磁率 をそれぞれε 0 ,μ 0 とすると、マクスウェル方程式により導かれる電磁波の速度1 /√ μ 0 ε 0 が真空中の光速度と一致する事が実験・観測により確かめられたので、光の正体は電磁波であると考えられるようになった。この事実から、
c = 1 μ 0 ε 0 {\displaystyle c={\frac {1}{\sqrt {\mu _{0}\varepsilon _{0}}}}} である。
さらに電場 E = (Ex ,Ey ,Ez ) と磁束密度 B = (Bx ,By ,Bz ) を用いて電磁テンソル を
( F α β ) α β := ( 0 − E x / c − E y / c − E z / c E x / c 0 − B z B y E y / c B z 0 − B x E z / c − B y B x 0 ) {\displaystyle (F^{\alpha \beta })_{\alpha \beta }:={\begin{pmatrix}0&-E_{x}/c&-E_{y}/c&-E_{z}/c\\E_{x}/c&0&-B_{z}&B_{y}\\E_{y}/c&B_{z}&0&-B_{x}\\E_{z}/c&-B_{y}&B_{x}&0\end{pmatrix}}} により定義する。
電磁場を別の慣性系から見た場合、電場と磁束密度がそれぞれE ′ = (E ′x ,E ′y ,E ′z ) とB ′ = (B ′x ,B ′y ,B ′z ) であったとし、これらから作った電磁テンソルをF ′αβ とする。
F ′αβ とFαβ がローレンツ・ブースト(L4) 式で移りあう為の必要十分条件は、
( E x ′ , B x ′ ) = ( E x , B x ) , ( E y ′ , B y ′ ) = γ ( E y − | v | B z , B y + | v | E z / c 2 ) , ( E z ′ , B z ′ ) = γ ( E z + | v | B y , B z − | v | E y / c 2 ) {\displaystyle {\begin{aligned}(E'_{x},B'_{x})&=(E_{x},B_{x}),\\(E'_{y},B'_{y})&=\gamma (E_{y}-|{\boldsymbol {v}}|B_{z},B_{y}+|{\boldsymbol {v}}|E_{z}/c^{2}),\\(E'_{z},B'_{z})&=\gamma (E_{z}+|{\boldsymbol {v}}|B_{y},B_{z}-|{\boldsymbol {v}}|E_{y}/c^{2})\end{aligned}}} が成立する事である事を簡単な計算で確認できる[ 48] [ 49] 。ここでv は2つの慣性系の間の相対速度で、γ = 1 /√ 1 − (|v |/c )2 はローレンツ因子である。
非相対論的極限v /c ≈ 0 ではγ ≈ 1 なので、上述の条件式は、古典電磁気学で知られている慣性系間の変換公式
に一致する。
よって電磁テンソルはローレンツ変換に対して共変であると結論づけられる。
特殊相対性理論以前のマックスウェル方程式の解釈には非対称性があった。例えば磁石を固定されたコイルに近づけた場合は電磁誘導 により電流が流れると解釈されるが、逆にコイルを固定された磁石に近づけた場合はローレンツ力 で電子が動かされることにより電流が流れると解釈された。今日的な視点から見れば、これら2つのケースは単なる慣性系の取り替えに過ぎないにも関わらず、両者の解釈が異なるのは不自然である。事実、流れる電流の量はどちらのケースであっても同一であり、磁石とコイルの相対速度だけで決まる。
このような非対称な解釈になったのは、当時は電場と磁束密度は完全に別概念であったことによる。(E1) 式も、今日の目から見ると電場と磁束密度を電磁テンソルという同一のテンソルとしてまとめるべき事を示唆しているように見えるが、当時は(E1) 式の第二項はあくまでも「仮想的な」電場や磁束密度の効果であるとみなされた。
上述したような理論の非対称性の解消に関心のあった[ 50] アインシュタイン は、特殊相対性理論によりこの非対称性を解消した[ 17] 。
すでに電磁テンソルがローレンツ変換に対して共変であることを示したので、マクスウェル方程式を電磁場テンソルで表せば、マクスウェル方程式もローレンツ変換に対して共変であることを示せる。
電磁テンソルと4元電流密度を使うとマクスウェル方程式の2式
∇ ⋅ E = ρ ϵ 0 ∇ × B − 1 c 2 ∂ E ∂ t = μ 0 j {\displaystyle {\begin{aligned}\nabla \cdot {\boldsymbol {E}}&={\frac {\rho }{\epsilon _{0}}}\\\nabla \times {\boldsymbol {B}}-{\frac {1}{c^{2}}}{\frac {\partial {\boldsymbol {E}}}{\partial t}}&=\mu _{0}{\boldsymbol {j}}\end{aligned}}} はいずれも
∂ α F α β = μ 0 j β {\displaystyle \partial _{\alpha }F^{\alpha \beta }=\mu _{0}j^{\beta }} と同一の形で表現でき、残りの2式
∇ ⋅ B = 0 ∂ B ∂ t + ∇ × E = 0 {\displaystyle {\begin{aligned}\nabla \cdot {\boldsymbol {B}}&=0\\{\frac {\partial {\boldsymbol {B}}}{\partial t}}+\nabla \times {\boldsymbol {E}}&=0\end{aligned}}} はいずれも
∂ γ F α β + ∂ α F β γ + ∂ β F γ α = 0 {\displaystyle \partial _{\gamma }F_{\alpha \beta }+\partial _{\alpha }F_{\beta \gamma }+\partial _{\beta }F_{\gamma \alpha }=0} (α ,β ,γ は相異なる)と同一の形で表現できる。なお、リッチ計算の記法を用いると、上の式は
∂ [ α F β γ ] = 0 {\displaystyle \partial _{[\alpha }F_{\beta \gamma ]}=0} とも表記できる。
マクスウェル方程式は微分形式 と外微分 を用いるとさらに簡潔に表現できる事が知られているが、微分形式に関する予備知識を必要とするので本節では述べない(マクスウェル方程式#微分形式による表現 を参照)。
電磁場には必ず以下の条件をみたす組φ,A (電磁ポテンシャル )が存在する事が知られている
本節では、電磁ポテンシャルの4元ベクトル版である4元ポテンシャル
を用いる事で、マクスウェル方程式を表現する。
1つの電磁場に対し(E2) 式を満たす電磁ポテンシャルは一意ではない事が知られている。そこでローレンツ共変性を損ねない形で電磁ポテンシャルを制限するため、4元勾配を使った以下の条件(ローレンツ・ゲージ )を課す:
このとき、マクスウェル方程式は4元電流密度を用いて
という一本の式で書き表せる。ここで
◻ := 1 c 2 ∂ 2 ∂ t 2 − ∂ 2 ∂ x 2 − ∂ 2 ∂ y 2 − ∂ 2 ∂ z 2 {\displaystyle \Box :={\frac {1}{c^{2}}}{\frac {\partial ^{2}}{\partial t^{2}}}-{\frac {\partial ^{2}}{\partial x^{2}}}-{\frac {\partial ^{2}}{\partial y^{2}}}-{\frac {\partial ^{2}}{\partial z^{2}}}} はダランベルシアン である。
今、電荷q を持った質点があるとし、この質点の4元速度をu→ とし、u→ の反変成分を(u 0 ,u 1 ,u 2 ,u 3 ) とする。このとき、この質点が電磁場から受ける4元力を、電磁場テンソルF αβ と、4元速度の共変成分u β =η βμ u μ を用いて、
によって定義すると、この4元力からできる質点の運動方程式は
d p α d τ = q F α β u β {\displaystyle {\frac {\mathrm {d} p^{\alpha }}{\mathrm {d} \tau }}=qF^{\alpha \beta }u_{\beta }} である。ここでp β は質点の4元運動量のβ 成分で、τ は質点の固有時間である。
上の運動方程式はα = 0, 1, 2, 3 に対して定義されているが、4元運動量と4元速度の空間成分(の共変表現)p = (p 1 ,p 2 ,p 3 ),v = (u 1 ,u 2 ,u 3 ) に着目すると、電磁場テンソルの定義より、運動方程式の空間成分は
左辺の空間成分= γ d p d t {\displaystyle =\gamma {\frac {\mathrm {d} {\boldsymbol {p}}}{\mathrm {d} t}}} 右辺の空間成分= γ q ( E + v × B ) {\displaystyle =\gamma q({\boldsymbol {E}}+{\boldsymbol {v}}\times {\boldsymbol {B}})} となることがわかる。ここでγ はローレンツ因子1 /√ 1 − (|v |/c )2 である。
すなわち相対論における運動方程式の空間成分は、ローレンツ力に関する運動方程式
d p d t = q ( E + v × B ) {\displaystyle {\frac {\mathrm {d} {\boldsymbol {p}}}{\mathrm {d} t}}=q({\boldsymbol {E}}+{\boldsymbol {v}}\times {\boldsymbol {B}})} と完全に一致する。
運動方程式の時間成分に関しては、cp 0 が質点のエネルギーE を表していた事に着目すると、
左辺の時間成分= γ c d E d t {\displaystyle ={\frac {\gamma }{c}}{\frac {\mathrm {d} E}{\mathrm {d} t}}} 右辺の時間成分= γ c ( q E ⋅ v ) {\displaystyle ={\frac {\gamma }{c}}(q{\boldsymbol {E}}\cdot {\boldsymbol {v}})} なので、下記の式が従う:
d E d t = q E ⋅ v = q ( E + v × B ) ⋅ v . {\displaystyle {\frac {\mathrm {d} E}{\mathrm {d} t}}=q{\boldsymbol {E}}\cdot {\boldsymbol {v}}=q({\boldsymbol {E}}+{\boldsymbol {v}}\times {\boldsymbol {B}})\cdot {\boldsymbol {v}}.} 右辺は単位時間当たりに電磁場のローレンツ力が質点に対してした仕事なので、この式はローレンツ力による仕事がエネルギーに変わる事を意味している。すなわちこれは、エネルギー保存則 にあたる式である[ 51] 。
特殊相対性理論は、次のような事象からも検証されている。
電場と磁場の統一理論としての特殊相対性理論の検証[ 注 27] 電流が流れる電線の周りに磁場が生じる。 時計の遅れの検証横方向のドップラー効果の測定(赤道上の時計の遅れの実験)[ 52] [ 注 28] メスバウアー効果 を起こす放射線源とその吸収体について、放射線源を回転する円盤の中心に、吸収体を円周に配置して回転させるとメスバウアー効果が発生しなくなる[ 53] [ 54] , 第7,8章[ 注 29] 。 ハフェル–キーティング実験 (Hafele–Keating experiment)航空機で運んだ原子時計 と地上で静止したままの原子時計との間に発生するズレが理論と誤差(不確定性原理 も含む)の範囲で一致する[ 55] 。なお、この実験における相対論効果は特殊相対性理論における運動によるいわゆる時計の遅れ、 一般相対性理論における重力偏移によるいわゆる時計の遅れ、 サニャック効果 (Sagnac effect) の3つが複合して現れる[ 注 30] 。 粒子の平均寿命 の延長宇宙線 の衝突により発生する非常に寿命の短い粒子が、単純に光速度程度で移動したと考えても数百メートル程度しか移動できないはずであるのに、地上で観測することができる。また、粒子加速器 で粒子を光速近くまで加速すると、崩壊するまでの寿命が延びる。なお、この寿命の延びは厳密に特殊相対性理論による予測に従う。 質量とエネルギーの等価性オットー・ハーン は核分裂 を発見したが、この反応の際の質量欠損 により、大量のエネルギーが放出された。この放出は特殊相対性理論の帰結のひとつである質量とエネルギーの等価性E =mc ² において欠損相当の質量に換算される原子核 内部の核子 の結合エネルギー である。 その他光速近くまで加速した電子 等の荷電粒子を磁場 によって曲げると、放射光 と呼ばれる光が発生する。この光は特殊相対性理論の効果により前方に集中し、粒子軌道の接線方向への極めて指向性の高い光となる。 特殊相対性理論すなわち慣性力のない慣性系を対象とする理論体系が一通り出来上がった後、アインシュタインは、非慣性系と重力場 へ対象を広げる仕事に取り組み、より一般的な理論である一般相対性理論 を導いた。
特殊相対性理論では「あらゆる慣性系どうしが等価である」ことを原理としたが、さらに「慣性力と重力 は本質的に区別がなく等価である」との視点に立ち、一般相対性理論を展開した。一般相対性理論によると、離れた観測者には光は速さが変化し曲線を描いて見える。この理論は、ニュートン の万有引力 論による物理事象の捉え方を、全面的かつ発展的に書き換える内容である。
一般相対性理論では思索の対象を慣性系以外にも広げており、その名の通り、特殊相対性理論は一般相対性理論の「特殊な場合」に相当し、一般相対性理論は特殊相対性理論を包含する理論である[ 注 31] 。これらの2つの相対性理論を総称して(あるいは、両者を区別をせずに)相対性理論 と呼ぶこともある。
^ ローレンツはこのようなエーテルに対して静止している系のことをそのまま『静止している系』または『静止系』と呼んだ[ 3] 。 ^a b ローレンツ–ポアンカレの理論ではその前提がはっきりと示されている広重 (1967 , p. 72)。 ^ ここで述べる意味での「本質的に形式が変化する」や「本質的に不変」といった表現に関しては、数学的に立ち入った説明が必要であり、概説・導入部の域を超えるので、詳説は以降の節の「共変」に関する説明を参照されたし。 ^ 即ち、もし両氏の仮説が正しいのなら、「光の速度差」を検出可能な精度を有していた。 ^ 特殊相対性理論では物体が実際に縮むという意味のフィッツジェラルド=ローレンツ収縮はしない。ローレンツの理論との混同を招き紛らわしいので特殊相対性理論では用いない方が良い用語である[要出典 ] 。 ^ この変換に対して最初にローレンツ変換という名称をあたえたのはポアンカレ である[ 14] 。 ^ ローレンツの理論では物体が実際に 収縮するとみなすので、運動する物体が一律に収縮するならば、「長さ」の基準となる物差しさえも収縮してしまい、結果として収縮は観測されない為に検証不能となる。一方、特殊相対性理論では実際に収縮するのではなく、同時である状態が座標系によって異なる(位置のみならず運動状態によっても同時性が異なる)ため収縮して観測される、とされる。特殊相対性理論においては普遍定数である光速を物差しとして「長さ」が再定義されており、上述した検証不能性の問題は生じない。 ^ ただし、ローレンツは局所時間をあくまで形式的なものだとした。 ^ ローレンツが提唱した時点ですでに楕円体に変形した電子の安定性についてマックス・アブラハム から批判が出ていた[ 16] 。 ^ 実際、アインシュタインの理論を認めたローレンツはローレンツ電子論 (1973 , p. 360) において『わたくしが誤った主な原因は、変数t だけが真の時間と見なしうるのであって、わたくしの局所時t' は補助的な数学的な量以上のものと見なしてはならないという観念を固守していたことである。それに反して、Einsteinの理論ではt' はt と同じ役を果たす。』(t' はこの節におけるτ である)と述懐している ^ 定式化して具体的に述べる。a(v)をvの関数として、c' = a(v)cとおく(a(v)が速さvの関数で向きによらないのは空間の等方性による)。特殊相対性原理より全ての慣性系は同等であるので逆にc = a(v)c'も言えて、a(v)2 {\displaystyle {}^{2}} =1よりc'=cを得る。 ^ マクスウェル方程式の解の導出経緯をたどれば、国際単位系での真空中の誘電率と透磁率という別の物理定数について、これら(の積)と光速は原理上同一のものである。 ^ 現に物理学者は、このような二人の観測者それぞれが観測する時刻・位置を自由に知ることができることを前提に、相対性理論の論じることができる(本記事の議論がまさにそれである)。これは相対性理論に基づく実験実施においても可能な行為である。 ^ 証明:Derivations of the Lorentz transformations - Wikipedia ^ 本項ではシュッツ (2010) に従い、4元ベクトルはa→ のように矢印をつけて表し、通常の3元ベクトルはa のように太字で表した。しかしベクトルの表記は本によって異なり、前原 (1993) では4元ベクトルを太字で表している。 ^ 厳密にいうと我々はここで、ミンコフスキー空間の向きづけが事前に定められていること 2つの光円錐のうち1つを「未来」の光円錐であると事前に定められていること を暗に仮定し、e → 0 が未来の光円錐内にあり、(e → 1 、e → 2 、e → 3 ) の向きがミンコフスキー空間の向きと一致する ものだけを考えることにしたのである。 ^ 数学的に言えば、ローレンツ群 O(1,3) は空間方向の向きを保つか、時間方向の向きを保つかにより、4つの連結成分に分割されており、そのうち単位元を含む連結成分である制限ローレンツ群SO+ 1,3) の元のみを考えるという事である。 ^ これは3次元空間上の回転Rにより、(e → 0 ,e → 1 ,e → 2 ,e → 3 ) を (e → 0 ,R(e → 1 ), R(e → 2 ), R(e → 3 )) に移し、(e → 0 ,e → 1 ,e → 2 ,e → 3 ) にも同様の変換を施す事を意味する。なお、(e → 0 ,e → 1 ,e → 2 ,e → 3 ) と (e → 0 ,e → 1 ,e → 2 ,e → 3 ) では用いる回転行列Rが異なってもよい。このような変換がミンコフスキー計量を保つ線形変換(従ってローレンツ変換)である事は簡単に確認できる。よってこれらの変換を施した後も (e → 0 ,e → 1 ,e → 2 ,e → 3 ) と (e → 0 ,e → 1 ,e → 2 ,e → 3 ) が正規直交基底であるという事実は保たれる。 ^ このように表示できるのは、ローレンツ変換の固有値がeζ 、e−ζ 、eια 、e−ια の形に書けることと関係している。ここでζ はラピディティ 。 ^ 符号が反転しているのは、v が観測者Aから見た観測者Bの相対速度であるのに対し、x ′/t ′ は観測者Bから見た観測者Aの相対的だからである。なお、特殊相対性理論においても観測者の入れ替えで相対速度の符号が反転するという事実はローレンツ変換の逆変換に対して同様の議論をする事で確認できる。 ^ 歴史的には、質量が速度と共に増加するとみなしp = M ( v ) v {\displaystyle {\boldsymbol {p}}=M(v){\boldsymbol {v}}} (ここでM ( v ) = γ m {\displaystyle M(v)=\gamma m} は「相対論的質量」と呼ばれる)と解釈することも行われたが、この概念はかえって混乱を招くため、現代の専門的な文脈で用いられることは稀である。 ^ 質量の電磁気学的概念(電磁質量概念)の詳細とその発展については、ヤンマー (1977) 第11章を参照。 ^ この関係はアインシュタインの論文『物体の慣性は、そのエネルギーの大きさに依存するか』[ 35] によって見出されたと言われる。ただし、この論文におけるE =mc ² の導出は循環論法になっているといわれる[ 36] 。 ^ たとえば、現実の実験で観測できている「物体」がそうであるように、ここでの物体の運動速度は光速未満であることを暗黙に仮定している。 ^a b 本項では(ミンコフスキー)計量により、ベクトル空間V とその双対空間V* が同一視できるケースのみを扱う。 ^ なお、特殊相対性理論の原論文 (アインシュタイン 1905a )はCGSガウス単位系 を用いている[疑問点 –ノート ] 。 ^ アインシュタインは一般相対性理論においては重力と慣性力を統一(等価原理)し、さらに晩年は電磁力と重力の統一を目指した統一理論を研究していた。 ^ 当初はアインシュタインにより地球の極と赤道上の実験として提案されたが、メスバウアー効果の発見により、実験室に配置した円盤上で検証可能となった。 ^ 他にも検証不可能だと思われていた一般相対性理論の検証もメスバウアー効果の発見によって可能となった。たとえば、重力偏移によるいわゆる時計の遅れなどについても既に検証されている。パウンド–レブカ実験 (Pound–Rebka experiment) など。 ^ GPS (Global Positioning System ; 全地球測位システム)も同様にこの3つの効果が現れるため、その分補正を行なわなくてはならない[ 56] 。^ ただし、各理論が専らに主張するテーマは、相対運動下での時空間の理解(特殊相対論)であったり、重力と時空間の計量の理解(一般相対論)であったり、といったように異なる。 ^ アインシュタイン 1905a .^a b c 佐藤 (1994) , p. 2. ^ ローレンツ電子論 (1973) .^ Hertz (1890) .^ 砂川 (1999) .^ 広重 (1980) , 『世代交代期における電磁理論』.^ 後藤 1970 ,[要ページ番号 ] .^ 砂川 1999 ,[要ページ番号 ] .^a b 佐藤 (1994) , p. 5. ^a b マイケルソン・モーリー (1887) . ^ 後藤 (1970) , p. 386–388.^ 砂川 1999 ,[要ページ番号 ] .^ Lorentz (1904) .^ ポアンカレ (1905) .^ Lorentz (1895) .^ ローレンツ電子論 (1973) , p. 235.^a b アインシュタイン (1905a) 及び『運動している物体の電気力学について 』[ 57] ^ 内山 (1977) , p. 6-7.^ パウリ (2007) , p. 33-36.^ 内山 (1977) , p. 7-8.^a b 佐藤 (1994) , p. 8. ^ シュッツ (2010) , p. 2.^ 広江 (2008) , p. 13.^ Landau & Lifshitz (1978) , p. 2.^a b 佐藤 (1994) , p. 9. ^a b c d e f Landau & Lifshitz (1978) , §2 世界間隔. ^ 野村 清英 (2019) , p. 5.^ Landau & Lifshitz (1978) , §5 速度の変換.^ シュッツ (2010) , p. 7.^ シュッツ (2010) , p. 57.^ 佐藤 1994 , p. 15.^ 佐藤 (1994) , p. 29.^ Landau, Lifshitz (3rd ed.) (1971) , p. 22.^ Landau, Lifshitz (3rd ed.) (1971) , p. 26.^ アインシュタイン (1905b) .^ ヤンマー (1977) , pp. 156–157.^ 佐藤 (1994) , p. 55.^ 佐藤 (1994) , p. 45.^ 佐藤 (1994) , p. 24.^ シュッツ (2010) , p. 22.^ 世界大百科事典 第2版『ローレンツ収縮 』 -コトバンク ^ 法則の辞典『フィッツジェラルド‐ローレンツ短縮 』 -コトバンク ^ ローレンツ電子論 (1973) , p. 214.^ 佐藤 (1994) , p. 17.^ 佐藤 (1994) , p. 21.^a b c 佐藤 (1994) , pp. 21–24, 59–50. ^ 前野昌弘 (2015年12月24日). “相対論2009年度第14回 ”. 物理Tips . 琉球大学 . 2016年5月23日閲覧。 ^ 佐藤 (1994) , p. 39.^ Landau, Lifshitz (3rd ed.) (1971) , p. 62.^ 広重 (1971) .^ 佐藤 (1994) , p. 46.^ 矢野 (1991) , p. 201.^ Hay (1960) .^ 相対性理論と量子力学の誕生 (1972) .^ 当時の映像 -YouTube ^ ジョーンズ (2001) , pp. 184–193.^ 矢野 (1991) , pp. 180–226.佐藤勝彦 著、長岡洋介、原康夫 編『相対性理論』岩波書店 〈岩波基礎物理シリーズ〉、1996年12月18日。ASIN 4000079298 。ISBN 4000079298 。 NCID BN15591416 。OCLC 675345203 。全国書誌番号 :97049882 。 シュッツ 著、江里口良治・二間瀬敏史 訳『特殊相対論』(第2版)丸善 〈シュッツ 相対論入門〉、2010年12月11日。ASIN 4621083104 。ISBN 978-4621083109 。 NCID BB04513937 。OCLC 744209903 。全国書誌番号 :21863153 。 ランダウ 、リフシッツ 著、恒藤敏彦 ・広重徹 訳『場の古典論=電気力学,特殊および一般相対性理論=』(原書第6版)東京図書出版 〈ランダウ=リフシッツ理論物理学教程〉、1978年10月30日。ASIN 448901161X 。ISBN 978-4489011610 。 NCID BN00890297 。OCLC 841897028 。全国書誌番号 :79000237 。 前原, 昭二『線形代数と特殊相対論』日本評論社 、1993年7月1日。ASIN 4535606064 。ISBN 978-4535606067 。 NCID BN09501532 。OCLC 674230845 。全国書誌番号 :93061332 。 H.A.ローレンツ 著、広重徹 訳『ローレンツ 電子論』1973年。 M.ボルン、W.ビーム 著、瀬谷 正男 訳『アインシュタインの相対性原理』講談社、1971年。 メラー 著、永田 恒夫, 伊藤 大介 訳『相対性理論』みすず書房、1959年。 矢野, 健太郎『アインシュタイン』講談社〈講談社学術文庫〉、1991年。 アインシュタイン 著、矢野健太郎 訳『相対論の意味』 附:非対称場の相対論、岩波書店、1958年。 砂川, 重信『理論電磁気学』(第3版)紀伊國屋書店、1999年。 砂川重信『電磁気学』(新装版)岩波書店、1987年(原著1977年)。 後藤, 憲一 著、山崎 修一郎 編『詳解電磁気学演習』1970年。 広重, 徹 「相対論はどこから生まれたか 」(PDF)『日本物理學會誌』第26巻第6号、日本物理学会 、1971年6月5日、380–388、doi :10.11316/butsuri1946.26.380 、ISSN 0029-0181 、NAID 110002072547 、OCLC 834302891 。 (広重, 徹 著、西尾成子 編『相対論の形成 −広重徹科学史論文集−』みすず書房、1980年。 )ファインマン 著、宮島 龍興 訳『ファインマン物理学〈3〉電磁気学』岩波書店、1986年。 遠藤, 雅守『電磁気学 初めて学ぶ電磁場理論』森北出版、2013年。 遠藤, 雅守『史上最強図解 これならわかる! 電磁気学』ナツメ社、2014年。 広重 徹『物理学史Ⅱ』培風館、1968年3月。ASIN 4563024066 。ISBN 4563024066 。 NCID BN00957321 。全国書誌番号 :68001733 。 野村, 清英 (2019年4月23日). “一般相対性理論 ”. 九州大学. p. 5. 2022年6月25日閲覧。 内山龍雄『相対性理論』岩波書店〈物理テキストシリーズ8〉、1977年3月。 W.パウリ『相対性理論(上)』筑摩書房、2007年12月。 広江克彦『趣味で相対論』理工図書、2008年6月。 時刻合わせ、電磁波測距儀、いわゆる時計の遅れの実験について 国立天文台 編『理科年表』(平成25年版)、2012年。 恒藤 敏彦『弾性体と流体』岩波書店〈物理入門コース 8〉、1983年9月14日。ASIN 4000076485 。ISBN 4000076485 。 NCID BN00620248 。全国書誌番号 :84005992 。 マックス・ヤンマー 著、大槻 義彦, 葉田野 義和, 斉藤 威 訳『質量の起源』講談社、1977年。 Lorentz, Hendrik Antoon (1895) (ドイツ語), Versuch einer Theorie der electrischen und optischen Erscheinungen in bewegten Körpern [運動する物体における電磁的・光学的現象を理論化する試み] , Leiden: E. J. Brill, ウィキソース より閲覧。 Lorentz, Hendrik Antoon (1904), “Electromagnetic phenomena in a system moving with any velocity smaller than that of light [光速以下の速度で運動する系における電磁現象] ” (英語), Proceedings of Royal Netherlands Academy of Arts and Sciences (Royal Netherlands Academy of Arts and Sciences ) 6 : 809–831, ウィキソース より閲覧。 H. Poincaré (23 July 1905), “Sur la dynamique de l'électron [電子の動力学について] ” (フランス語), Rendiconti del Circolo matematico di Palermo 21 : 129–176, ウィキソース より閲覧。 Albert Einstein; Hermann Minkowski (1920). The principle of relativity; original papers . Meghnad Saha, Satyendranath Bose (translate). OCLC 6308161 . https://archive.org/details/principleofrelat00eins H. J. Hay; J. P. Schiffer; T. E. Cranshaw; P. A. Egelstaff (15 February 1960). “Measurement of the Red Shift in an Accelerated System Using the Mössbauer Effect in Fe57 ” . Phys. Rev. Lett. (Harwell, England: Atomic Energy Research Establishment) 4 (4): 165–166. doi :10.1103/PhysRevLett.4.165 . http://journals.aps.org/prl/pdf/10.1103/PhysRevLett.4.165 .