arXiv探訪

興味の赴くままに数学するだけ

行列式の導出について

だんだん日が短くなってきて、あぁ今年ももう終わりかと思うようになりました。夕日をぼんやり眺めていると、ふと「行列式ってなんだろう?」という疑問が湧いてきたのです。もちろん定義は頭に入っています。色んなやり方があり、様々な性質を示すことだって多分できます。でもその定義がどこから来るのかという疑問について、今まで一度たりとも考えたことはありませんでした。本やネットを調べてみました。しかし納得できる説明はありませんでした。強いて言えば、歴史的に長い時間を掛けて整理された式であるということが分かった位でした。なので自分で納得できる理解の仕方が欲しいなと思い、少し考えてみることにしました。

素朴な発想

行列論の源は、次の連立一次方程式を解く、ということにあったはずです。

{ \begin{align*} a_{11}x_{1} + \dotsb + a_{1n}x_{n} &= y_{1} \\ &\vdots  \\ a_{m1}x_{1} + \dotsb + a_{mn}x_{n} &= y_{m} \end{align*} }

これを{ Ax=y }と書いたのがスタートラインであり、与えられた{ y }に対して上の式を満たす{ x }を求めるという問題が、過不足のない{ n=m }のときに必ず解けるかが肝になります。

ひとまず解があることをすぐに判断できる簡単な状況から考えます。上三角の場合、つまり{ i \gt j }なら{ a_{ij}=0 }を満たすときを考えてみます。

{ \begin{align*} a_{11}x_{1} +  &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}x_{2} + \dotsb + &a_{2n}x_{n} &= y_{2} \\ & & \vdots & \\ & &a_{nn}x_{n} &= y_{n} \end{align*} }

このとき、もし{ a_{11}\neq 0, \dotsc, a_{nn}\neq 0 }が成り立つならば、{ x_{n} }から順繰りに式を計算することで、件の問題は解けることが分かります。このことから、問題が可解であるかどうかを決定づける(determine)式として、

{ a_{11}a_{22} \dotsm a_{nn} }

が妥当であることが分かります。今は形式的な議論なので、整域性などは深く考えないようにします。

一般的な行列式の定義

一般の連立方程式であっても上三角に変形できることは、数学科の学生に限らず、全ての大学生が等しく学ぶはずです。{ 1 }行目の式を{ a_{11}^{-1} }倍して、各{ k }行に{ a_{k1} }倍したものを加えることで、{ 2 }から{ n }行目の式から{ x_{1} }を「消去」できます。

{ \begin{align*} a_{11}x_{1} +a_{12}x_{2} &+\dotsb=y_{1} \\  (a_{22}-a_{21}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{2}-a_{21}a_{11}^{-1}y_{1} \\ &\vdots \\ (a_{n2}-a_{n1}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{n}-a_{n1}a_{11}^{-1}y_{1} \end{align*} }

ここで{ 2 }行目以降に着目してみます。

{ a_{ij}^{( 1 )}:=a_{ij}-a_{i1}a_{11}^{-1}a_{1j}, \quad y_{j}^{( 1 )}:=y_{j}-a_{j1}a_{11}^{-1}y_{1} }

と置くことで得られる

{ \begin{align*} a_{22}^{( 1 )}x_{2} + \dotsb + a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ &\vdots  \\ a_{n2}^{( 1 )}x_{2} + \dotsb + a_{nn}^{( 1 )}x_{n} &= y_{n}^{( 1 )} \end{align*} }

についても同様な操作を行ってみます。再び

{ a_{ij}^{( s )}:=a_{ij}^{( s-1 )}-a_{is}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}a_{sj}^{( s-1 )},\quad y_{j}^{( s )}:=y_{j}^{( s-1 )}-a_{js}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}y_{s}^{( s-1 )} }

と置けば、結局

{ \begin{align*} a_{11}x_{1} +  &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}^{( 1 )}x_{2} + \dotsb + &a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ & & \vdots & \\ & &a_{nn}^{( n-1 )}x_{n} &= y_{n}^{( n-1 )} \end{align*} }

という上三角行列を得ることができます。

先の素朴な考察を思い出せば、一般的な行列に対しては

{ \mathrm{det}A:=a_{11}a_{22}^{( 1 )} \dotsm a_{nn}^{( n-1 )} }

を計算すれば良いと分かります。

可換の場合

可換性を仮定して少し計算してみると、馴染みの深い式が出てきます。

{ n=1 }のときは{ a_{11} }です。

{ n=2 }のときは{ a_{11}a_{22}^{( 1 )}=a_{11}(a_{22}-a_{21}a_{11}^{-1}a_{12})=a_{11}a_{22}-a_{21}a_{12} }です。

{ n=3 }を気合いで計算すると、

{ \begin{align*} a_{11}a_{22}a_{33}-a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33} \\ -a_{11}a_{23}a_{32}+a_{13}a_{21}a_{32}+a_{12}a_{23}a_{31} \end{align*} }

となります。

式の形から、次の予想が成り立ちます。

定理 可換性を仮定すれば、

{ \displaystyle \mathrm{det}A=\sum_{\sigma\in S_{n}} \mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )} }

が成り立つ。ただし{ \sigma\in S_{n} }{ n }文字の置換全体を動く。

(証明){ n }に関する帰納法で示す。まず

{ \displaystyle \mathrm{det}A=a_{11}\mathrm{det}\left(\begin{matrix}a_{22}^{( 1 )} & \cdots & a_{2n}^{( 1 )} \\ \vdots & & \vdots \\ a_{n2}^{( 1 )} & \cdots & a_{nn}^{( 1 )} \end{matrix}\right) }

であるから、帰納法の仮定より

{ \displaystyle \mathrm{det}A=a_{11}\sum_{\sigma}\mathrm{sgn}\sigma\cdot a_{2\sigma( 2 )}^{( 1 )}\dotsm a_{n\sigma( n )}^{( 1 )} }

が従う。和を前に出すと、中身は

{ \displaystyle \sum_{S\subset\lbrace 2, 3, \dotsc, n \rbrace}\mathrm{sgn}\sigma\cdot (a_{11}^{-1})^{n-2}\prod_{i\in S}a_{11}a_{i\sigma( i )}\prod_{j\notin S}(-1)a_{j1}a_{1\sigma( j )} }

となる。もし異なる{ j, k\notin S }があれば、{ \tau:=\langle j, k \rangle\sigma }とすると、{ i\neq j, k }に対して{ \sigma( i )=\tau( i ) }だから、符号のみがずれて、お互いに打ち消し合ってしまう。故に

{ \displaystyle \mathrm{det}A=\sum_{\sigma}\mathrm{sgn}\sigma \left\lbrace a_{11}a_{2\sigma( 2 )}\dotsm a_{n\sigma( n )}-\sum_{i=2}^{n}a_{1\sigma( i )}a_{2\sigma( 2 )}\dotsm a_{i1} \dotsm a_{n\sigma( n )} \right\rbrace }

を得る。前は添え字{ 1 }に関係しない部分、後ろは添え字の{ 1 }{ i }を互換したものに相当するから、これは

{ \displaystyle \sum_{\sigma\in S_{n}}\mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )} }

に等しい。{ \square }

まとめ

上記の考察から、連立方程式の可解性を決定する式という素朴な発想から、行列式の通常の定義を導くことができました。いつも天下り的に定義するのが不満だったのですが、一応納得できそうな屁理屈を述べることができたのではないかと思います。帰納的定義など、他の方法でもこのような意味付けができるかは不明です。