2017-11-10

行列式の導出について

数学

だんだん日が短くなってきて、あぁ今年ももう終わりかと思うようになりました。夕日をぼんやり眺めていると、ふと「行列式ってなんだろう？」という疑問が湧いてきたのです。もちろん定義は頭に入っています。色んなやり方があり、様々な性質を示すことだって多分できます。でもその定義がどこから来るのかという疑問について、今まで一度たりとも考えたことはありませんでした。本やネットを調べてみました。しかし納得できる説明はありませんでした。強いて言えば、歴史的に長い時間を掛けて整理された式であるということが分かった位でした。なので自分で納得できる理解の仕方が欲しいなと思い、少し考えてみることにしました。

素朴な発想

行列論の源は、次の連立一次方程式を解く、ということにあったはずです。

${ \begin{align*} a_{11}x_{1} + \dotsb + a_{1n}x_{n} &= y_{1} \\ &\vdots \\ a_{m1}x_{1} + \dotsb + a_{mn}x_{n} &= y_{m} \end{align*} }$

これを ${ Ax=y }$ と書いたのがスタートラインであり、与えられた ${ y }$ に対して上の式を満たす ${ x }$ を求めるという問題が、過不足のない ${ n=m }$ のときに必ず解けるかが肝になります。

ひとまず解があることをすぐに判断できる簡単な状況から考えます。上三角の場合、つまり ${ i \gt j }$ なら ${ a_{ij}=0 }$ を満たすときを考えてみます。

${ \begin{align*} a_{11}x_{1} + &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}x_{2} + \dotsb + &a_{2n}x_{n} &= y_{2} \\ & & \vdots & \\ & &a_{nn}x_{n} &= y_{n} \end{align*} }$

このとき、もし ${ a_{11}\neq 0, \dotsc, a_{nn}\neq 0 }$ が成り立つならば、 ${ x_{n} }$ から順繰りに式を計算することで、件の問題は解けることが分かります。このことから、問題が可解であるかどうかを決定づける（determine）式として、

${ a_{11}a_{22} \dotsm a_{nn} }$

が妥当であることが分かります。今は形式的な議論なので、整域性などは深く考えないようにします。

一般的な行列式の定義

一般の連立方程式であっても上三角に変形できることは、数学科の学生に限らず、全ての大学生が等しく学ぶはずです。 ${ 1 }$ 行目の式を ${ a_{11}^{-1} }$ 倍して、各 ${ k }$ 行に ${ a_{k1} }$ 倍したものを加えることで、 ${ 2 }$ から ${ n }$ 行目の式から ${ x_{1} }$ を「消去」できます。

${ \begin{align*} a_{11}x_{1} +a_{12}x_{2} &+\dotsb=y_{1} \\ (a_{22}-a_{21}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{2}-a_{21}a_{11}^{-1}y_{1} \\ &\vdots \\ (a_{n2}-a_{n1}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{n}-a_{n1}a_{11}^{-1}y_{1} \end{align*} }$

ここで ${ 2 }$ 行目以降に着目してみます。

${ a_{ij}^{( 1 )}:=a_{ij}-a_{i1}a_{11}^{-1}a_{1j}, \quad y_{j}^{( 1 )}:=y_{j}-a_{j1}a_{11}^{-1}y_{1} }$

と置くことで得られる

${ \begin{align*} a_{22}^{( 1 )}x_{2} + \dotsb + a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ &\vdots \\ a_{n2}^{( 1 )}x_{2} + \dotsb + a_{nn}^{( 1 )}x_{n} &= y_{n}^{( 1 )} \end{align*} }$

についても同様な操作を行ってみます。再び

${ a_{ij}^{( s )}:=a_{ij}^{( s-1 )}-a_{is}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}a_{sj}^{( s-1 )},\quad y_{j}^{( s )}:=y_{j}^{( s-1 )}-a_{js}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}y_{s}^{( s-1 )} }$

と置けば、結局

${ \begin{align*} a_{11}x_{1} + &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}^{( 1 )}x_{2} + \dotsb + &a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ & & \vdots & \\ & &a_{nn}^{( n-1 )}x_{n} &= y_{n}^{( n-1 )} \end{align*} }$

という上三角行列を得ることができます。

先の素朴な考察を思い出せば、一般的な行列に対しては

${ \mathrm{det}A:=a_{11}a_{22}^{( 1 )} \dotsm a_{nn}^{( n-1 )} }$

を計算すれば良いと分かります。

可換の場合

可換性を仮定して少し計算してみると、馴染みの深い式が出てきます。

${ n=1 }$ のときは ${ a_{11} }$ です。

${ n=2 }$ のときは ${ a_{11}a_{22}^{( 1 )}=a_{11}(a_{22}-a_{21}a_{11}^{-1}a_{12})=a_{11}a_{22}-a_{21}a_{12} }$ です。

${ n=3 }$ を気合いで計算すると、

${ \begin{align*} a_{11}a_{22}a_{33}-a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33} \\ -a_{11}a_{23}a_{32}+a_{13}a_{21}a_{32}+a_{12}a_{23}a_{31} \end{align*} }$

となります。

式の形から、次の予想が成り立ちます。

定理可換性を仮定すれば、

$\mathrm{det}A=\sum_{\sigma\in S_{n}} \mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )}$

が成り立つ。ただし ${ \sigma\in S_{n} }$ は ${ n }$ 文字の置換全体を動く。

（証明） ${ n }$ に関する帰納法で示す。まず

$\mathrm{det}A=a_{11}\mathrm{det}\left(\begin{matrix}a_{22}^{( 1 )} & \cdots & a_{2n}^{( 1 )} \\ \vdots & & \vdots \\ a_{n2}^{( 1 )} & \cdots & a_{nn}^{( 1 )} \end{matrix}\right)$

であるから、帰納法の仮定より

$\mathrm{det}A=a_{11}\sum_{\sigma}\mathrm{sgn}\sigma\cdot a_{2\sigma( 2 )}^{( 1 )}\dotsm a_{n\sigma( n )}^{( 1 )}$

が従う。和を前に出すと、中身は

$\sum_{S\subset\lbrace 2, 3, \dotsc, n \rbrace}\mathrm{sgn}\sigma\cdot (a_{11}^{-1})^{n-2}\prod_{i\in S}a_{11}a_{i\sigma( i )}\prod_{j\notin S}(-1)a_{j1}a_{1\sigma( j )}$

となる。もし異なる ${ j, k\notin S }$ があれば、 ${ \tau:=\langle j, k \rangle\sigma }$ とすると、 ${ i\neq j, k }$ に対して ${ \sigma( i )=\tau( i ) }$ だから、符号のみがずれて、お互いに打ち消し合ってしまう。故に

$\mathrm{det}A=\sum_{\sigma}\mathrm{sgn}\sigma \left\lbrace a_{11}a_{2\sigma( 2 )}\dotsm a_{n\sigma( n )}-\sum_{i=2}^{n}a_{1\sigma( i )}a_{2\sigma( 2 )}\dotsm a_{i1} \dotsm a_{n\sigma( n )} \right\rbrace$

を得る。前は添え字 ${ 1 }$ に関係しない部分、後ろは添え字の ${ 1 }$ と ${ i }$ を互換したものに相当するから、これは

$\sum_{\sigma\in S_{n}}\mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )}$

に等しい。 ${ \square }$

まとめ

上記の考察から、連立方程式の可解性を決定する式という素朴な発想から、行列式の通常の定義を導くことができました。いつも天下り的に定義するのが不満だったのですが、一応納得できそうな屁理屈を述べることができたのではないかと思います。帰納的定義など、他の方法でもこのような意味付けができるかは不明です。

2017-10-18

重み付き余代数グラフ（weighted graph coalgebra）

数学

以前「余代数のグラフ表現について」という記事を書いた。

arxiv.hatenablog.com

最後の方に述べた注意で、例4に挙げたdivided power coalgebraはグラフ余代数（またはその剰余）として表すことが出来ない（知られていない）が、適切な重みを付けてやれば良いだろうと書いた。最近になって真面目に計算してみたら、2変数の重み付けではダメで3変数にしたらいい感じになったので報告しておく。

グラフ余代数

まず簡単なおさらいから始めよう。

${ R }$ は可換環とする。 ${ i\in I }$ を頂点とする有向グラフ ${ \Gamma }$ は反射的（ ${ i\rightarrow i }$ ）かつ推移的（ ${ i\rightarrow j, j\rightarrow k }$ なら ${ i\rightarrow k }$ ）かつ局所有限（ ${ \sharp\lbrace k : i\rightarrow k\rightarrow j \rbrace \lt \infty }$ ）であるとする。辺 ${ e_{ij} }$ の自由加群 ${ C:=\bigoplus Re_{ij} }$ において、

$\Delta (e_{ij}):=\sum_{i\rightarrow k\rightarrow j}e_{ik}\otimes e_{kj}$

及び ${ \epsilon(e_{ij})=\delta_{i, j} }$ と定めると組 ${ (C, \Delta, \epsilon) }$ は余代数を定める。即ち

${ \begin{align*} \Delta\otimes\mathrm{id}\circ\Delta=\mathrm{id}\otimes\Delta\circ\Delta, \\ \epsilon\otimes\mathrm{id}\circ\Delta=(C\xrightarrow{\cong} R\otimes C), \\ \mathrm{id}\otimes\epsilon\circ\Delta=(C\xrightarrow{\cong} C\otimes R) \end{align*} }$

が成り立つ。この余代数をグラフ余代数と呼ぶ。

一方のdivided power coalgebraとは ${ C=\oplus_{n\ge 0}Rd_{n} }$ として、

$\Delta(d_{n})=\sum_{k=0}^{n}\left(\begin{matrix}n \\ k\end{matrix}\right)d_{k}\otimes d_{n-k}$

及び ${ \epsilon(d_{n})=\delta_{n, 0} }$ はクロネッカーのデルタ、と定めたものだ。係数が違うのでグラフ余代数ではない。

重み付きグラフ余代数（weighted graph coalgebra）を以下で定めよう。「重み」とは ${ i\rightarrow k\rightarrow j }$ に対する ${ \gamma_{ikj}\in R }$ のことである。

定理重み ${ \lbrace \gamma_{abc} \rbrace }$ は以下の条件を満たすとする。

${ \begin{align*} \gamma_{abc}\gamma_{acd}&=\gamma_{abd}\gamma_{bcd} \quad (a\rightarrow b\rightarrow c\rightarrow d) \\ \gamma_{iij}&=\gamma_{ijj}=1 \end{align*} }$

このとき

$\begin{align*} \Delta(e_{ij})&:=\sum_{i\rightarrow k\rightarrow j}\gamma_{ikj}e_{ik}\otimes e_{kj}, \\ \epsilon(e_{ij})&=\delta_{i, j} \end{align*}$

は余代数を定める。

定義上記を重み付きグラフ余代数と呼ぶ。

例えば先ほどのdivided power coalgebraは、 ${ i \le j }$ について ${ i\rightarrow j }$ としたときの、

$\gamma_{abc}=\frac{(c-a)!}{(b-a)!(c-b)!}$

による重み付きグラフ余代数である。

数論的関数に関する例

最近、数論的関数について調べていたのもあり、面白そうな例を思いついた。

${ \mathbb{N}=\lbrace 1, 2, 3, \dotsc \rbrace }$ について ${ d|n }$ のとき ${ d\rightarrow n }$ と定める。これは推移的かつ局所有限である。今 ${ R=\mathbb{C} }$ とし、数論的関数 ${ f:\mathbb{N}\rightarrow\mathbb{C} }$ による重み付けを考えたい。重みを

$\gamma_{abc}:=e^{f(c/a)-f(b/a)-f(c/b)}$

と定めると、上記の条件を満たすには ${ f(1)=0 }$ であればよい。つまりconvolutionで可逆でない数論的関数に対し、重み付けグラフ余代数が定義できる。

もちろん重みの付け方は他にもあるだろう。いずれにせよ（重み付け）グラフ余代数は例が非常に豊富なので、何か新しいことができる予感はある。「こんな結果があるよ」というのがあれば、コメントなり表示名 - Mathtodonなりで是非教えてください。

2017-10-05

MathPower会場変更

数学一般

MathPowerの会場がスパイラルホール(東京・青山)に変更されたらしいです。

www.spiral.co.jp

こんな直近で変えられるものなのか（驚愕）参加者が増えたのだと思いましょう。

あと正多角形の作図は作図ソフトgeogebraを用いて行われるそうです。賢明な判断だと思います（なお手数）。

【拡散希望！】mathpower会場がスパイラルホール(東京・青山)に変更されたことにより、7、8日両日とも席数が大幅に増えています！
この機会にぜひチケットをお求めください！
二日間に渡る数学のお祭り、会場で味わい尽くしましょう！https://t.co/bgG3eEtlcB
— MathPower@10/7,8開催！ (@mathpower2016) 2017年10月5日

arXiv探訪

興味の赴くままに数学するだけ