2017-11-23

線型写像のちょっとした拡張について

数学

行列の基本的な事柄について見直し中。今回は双対変換と双一次形式、その行列表示に関する三位一体のお話。

${ \sigma }$ -線型写像

体の拡大 ${ L/K }$ 及び ${ K }$ -同型 ${ \sigma:L\rightarrow L }$ について考える。 ${ L }$ -ベクトル空間 ${ V_{n}, W_{m} }$ について、 ${ f:V_{n}\rightarrow W_{m} }$ が ${ \sigma }$ -線型であるとは、 ${ f }$ が加法的かつ ${ f(\lambda x)=\sigma(\lambda)f(x) }$ を満たすことをいう。

例えば ${ \sigma=\mathrm{id} }$ のときは普通の線型写像、 ${ \mathbb{C}/\mathbb{R} }$ で ${ \sigma(\lambda):=\overline{\lambda} }$ のときは共役線型（conjugate-linear）写像になる。これらを一つに纏めた議論を行うのが今回の目的でもある。

さて、 ${ V_{n} }$ の基底を ${ B=\lbrace v_{1}, \dotsc, v_{n} \rbrace }$ 、 ${ W_{m} }$ の基底を ${ C=\lbrace w_{1}, \dotsc, w_{m} \rbrace }$ とする。このとき ${ \sigma }$ -線型写像 ${ f: V_{n}\rightarrow W_{m} }$ が ${ (B, C) }$ に関する行列表示を持つことを示そう。まず ${ B_{n} }$ に対して

${ \begin{align*} f(v_{1}) &= \alpha_{11}w_{1}+\dotsb+\alpha_{m1}w_{m} \\ \vdots & \\ f(v_{n}) &= \alpha_{1n}w_{1}+\dotsb+\alpha_{mn}w_{m} \end{align*} }$

と一意的に表せるので、 ${ x=\xi_{1}v_{1}+\dotsb+\xi_{n}v_{n}\in V_{n} }$ について

$\begin{align*} f(x) &=\sum_{j}\sigma(\xi_{j})(\alpha_{1j}w_{1}+\dotsb+\alpha_{mj}w_{m}) \\ &=\left(\sum_{j}\sigma(\xi_{j})\alpha_{1j}\right) w_{1}+\dotsb+\left(\sum_{j}\sigma(\xi_{j})\alpha_{mj}\right) w_{m} \end{align*}$

が従う。そこで ${ \eta_{j}:=\sum_{j}\sigma(\xi_{i})\alpha_{ji} }$ と定めれば ${ f(x)=\eta_{1}w_{1}+\dotsb+\eta_{m}w_{m} }$ であり、 ${ m\times n }$ 行列 ${ A=(\alpha_{ij}) }$ について

${ \left(\begin{matrix}\eta_{1} \\ \vdots \\ \eta_{m} \end{matrix}\right) = A\left(\begin{matrix}\sigma(\xi_{1}) \\ \vdots \\ \sigma(\xi_{n}) \end{matrix}\right) = A\circ\sigma\left(\begin{matrix} \xi_{1} \\ \vdots \\ \xi_{n} \end{matrix}\right) }$

が成り立つ。逆に ${ A }$ を与えれば上の式より ${ \sigma }$ -線型写像 ${ f }$ が定まり、この対応は互いに逆を定める。このとき ${ A }$ を ${ f }$ の ${ (B, C) }$ に関する行列表示という。

この議論から次の命題が成り立つことが分かる。

命題 ${ \sigma }$ -線型写像全体は「普通の」線型空間になり、その次元は ${ n\times m }$ となる。

基底を変えると、行列表示はどのように変化するだろうか。今、 ${ V_{n} }$ の基底 ${ B, B^{\prime} }$ 及び ${ W_{m} }$ の基底 ${ C, C^{\prime} }$ を取り、可逆な行列 ${ P=(p_{ij}), Q=(q_{ij}) }$ を用いて

${ \begin{align*} \lbrack v^{\prime}_{1}, \dotsc, v^{\prime}_{n} \rbrack &= \lbrack v_{1}, \dotsc, v_{n} \rbrack P \\ \lbrack w^{\prime}_{1}, \dotsc, w^{\prime}_{m} \rbrack &= \lbrack w_{1}, \dotsc, w_{m} \rbrack Q \end{align*} }$

が成り立つとする。ただし、これらの式は ${ v^{\prime}_{j}=\sum_{k}p_{kj}v_{k}, w^{\prime}_{j}=\sum_{k}q_{kj}w_{k} }$ の意味で用いている。さて、 ${ f:V_{n}\rightarrow W_{m} }$ の ${ (B, C) }$ 及び ${ (B^{\prime}, C^{\prime}) }$ に関する行列表示をそれぞれ ${ A, A^{\prime} }$ としよう。即ち

${ \begin{align*} \lbrack f(v_{1}), \dotsc, f(v_{n}) \rbrack &= \lbrack w_{1}, \dotsc, w_{m} \rbrack A \\ \lbrack f(v^{\prime}_{1}), \dotsc, f(v^{\prime}_{n}) \rbrack &= \lbrack w^{\prime}_{1}, \dotsc, w^{\prime}_{m} \rbrack A^{\prime} \end{align*} }$

が成り立つとする。

$f(v^{\prime}_{j}) = f\left(\sum_{k}p_{kj}v_{k}\right) = \sum_{k}\sigma(p_{kj})f(v_{j})$

より、

${ \begin{align*} \lbrack f(v^{\prime}_{1}), \dotsc, f(v^{\prime}_{n}) \rbrack &= \lbrack f(v_{1}), \dotsc, f(v_{n}) \rbrack (\sigma P) \\ &= \lbrack w_{1}, \dotsc, w_{m} \rbrack A(\sigma P) \\ &= \lbrack w^{\prime}_{1}, \dotsc, w^{\prime}_{m} \rbrack Q^{-1}A(\sigma P) \end{align*} }$

を得る。以上より行列表示の一意性から ${ A^{\prime}=Q^{-1}A(\sigma P) }$ が成り立つことが分かる。

この関係（ ${ \exists Q, P( A^{\prime}=Q^{-1}A(\sigma P) }$ ）は反射的かつ推移的だが、対称的とは限らない。 ${ \sigma^{-1}=\sigma }$ であれば対称的となり、同値関係を定める。

${ \sigma }$ -双対空間

ここでは ${ W_{m}=L }$ について考える。このとき ${ V=V_{n} }$ 上の ${ \sigma }$ -線型写像 ${ f:V\rightarrow L }$ 全体を ${ V^{\sigma} }$ と表し、 ${ V }$ の ${ \sigma }$ -双対空間と呼ぶ。前節の通り ${ V^{\sigma} }$ は線形空間であり、その次元は ${ V }$ の次元 ${ n }$ に等しい。

${ V^{\sigma} }$ の基底に関しては次が言える。

命題 ${ V }$ の基底を ${ B=\lbrace e_{1}, \dotsc, e_{n} \rbrace }$ とする。このとき ${ e_{i}^{\sigma}(\xi_{j}e_{j})=\sigma(\xi_{j})\delta_{ij} }$ で定まる ${ \sigma }$ -線型写像 ${ e_{i}^{\sigma}\in V^{\sigma} }$ について、 ${ B^{\sigma}:=\lbrace e_{1}^{\sigma}, \dotsc, e_{n}^{\sigma} \rbrace }$ は ${ V^{\sigma} }$ の基底を定める。

（証明） ${ e_{i}^{\sigma} }$ が ${ \sigma }$ -線型写像になることは明白なので、基底であることを示そう。 ${ f\in V^{\sigma} }$ に対し、 ${ \phi_{i}:=f(e_{i}) }$ と定める。すると

${ ( \sum c_{i}e_{i}^{\sigma} )( \sum \xi_{j}e_{j} ) = \sum c_{i}\sigma( \xi_{j} )\delta_{ij} = \sum \sigma( \xi_{j} )c_{j} = f( \sum \xi_{j}e_{j} ) }$

となるので、 ${ f=\sum c_{i}e_{i}^{\sigma} }$ と表せる。また ${ \sum c_{i}e_{i}^{\sigma}=0 }$ なら ${ \sum c_{i}e_{i}^{\sigma}(e_{j})=c_{j}=0 }$ となるので、 ${ e_{i}^{\sigma} }$ 達は一次独立である。 ${ \square }$

命題の ${ B^{\sigma} }$ を ${ \sigma }$ -双対基底と呼ぶ。

ここで ${ \sigma }$ -ペアリングというものを考えよう。 ${ x\in V, f\in V^{\sigma} }$ に対し ${ (x, f)_{\sigma}:=f(x) }$ と定めれば、第一成分について ${ \sigma }$ -線型、第二成分について線型な写像（ ${ \sigma }$ -双線型写像とも呼ぶ） ${ (\cdot, \cdot)_{\sigma}:V\times V^{\sigma}\rightarrow L }$ を与えることができる。

基底 ${ B, B^{\sigma} }$ を取れば、その成分表示

${ (\sum\xi_{i}e_{i}, \sum\phi_{j}e_{j}^{\sigma})_{\sigma} = \sum\sigma(\xi_{i})\phi_{j}(e_{i}, e_{j}^{\sigma})_{\sigma} = \sum \sigma(\xi_{j})\phi_{j} }$

を得ることができる。

命題 ${ x\in V }$ に対して ${ \widehat{x}:V^{\sigma}\rightarrow L }$ を、 ${ \widehat{x}(f)=\sigma^{-1}( (x, f)_{\sigma} ) }$ により定める。このとき ${ x\mapsto \widehat{x} }$ は ${ V }$ と ${ (V^{\sigma})^{\sigma^{-1}} }$ の線形空間としての同型写像を与える。

（証明） ${ \widehat{x} }$ は ${ V^{\sigma} }$ 上の ${ \sigma^{-1} }$ -線型写像となる。実際

${ \widehat{x}(\lambda f)=\sigma^{-1}( (x, \lambda f)_{\sigma} )=\sigma^{-1}( \lambda (x, f)_{\sigma} ) = \sigma^{-1}(\lambda)\widehat{x}(f) }$

が成り立つ。また ${ V }$ の基底 ${ B }$ を取れば、 ${ x\neq y }$ に対し ${ x-y=\sum\xi_{j}e_{j} }$ と表せば、ある ${ i }$ について ${ \xi_{i}\neq 0 }$ となる。ここで ${ f:=e_{i}^{\sigma} }$ について ${ \widehat{x-y}(e_{i}^{\sigma})=\xi_{i}\neq 0 }$ が成り立つが、 ${ \widehat{x-y}=\widehat{x}-\widehat{y} }$ なので、結局 ${ \widehat{x}\neq \widehat{y} }$ が分かる。つまり ${ x\mapsto \widehat{x} }$ は単射であり、 ${ \mathrm{dim}V=\mathrm{dim}V^{\sigma}=\mathrm{dim}(V^{\sigma})^{\sigma^{-1}} }$ より同型となることが分かる。 ${ \square }$

以下もほぼ明らかだろう。

${ V_{k}\subset V_{n} }$ を ${ k }$ 次元部分空間とする。 ${ \lbrace f\in V_{n}^{\sigma} : (x, f)_{\sigma}=0, \quad \forall x\in V_{k} \rbrace }$ は ${ V_{n}^{\sigma} }$ の ${ n-k }$ 次元部分空間となる。
${ V_{k}^{\sigma}\subset V_{n}^{\sigma} }$ を ${ k }$ 次元部分空間とする。 ${ \lbrace x\in V_{n} : (x, f)_{\sigma}=0, \quad \forall f\in V_{k}^{\sigma} \rbrace }$ は ${ V_{n} }$ の ${ n-k }$ 次元部分空間となる。

${ \sigma }$ -双対変換と ${ \sigma }$ -双一次形式

${ \sigma }$ -線型写像 ${ A: V_{n}\rightarrow W_{m}^{\sigma} }$ のことを ${ \sigma }$ -一次変換と呼ぶことにしよう。このとき任意の ${ x\in V_{n}, y\in W_{m} }$ に対して

${ (y, Ax)_{\sigma}=\sigma( (x, By)_{\sigma} ) }$

を満たす ${ \sigma }$ -一次変換 ${ B: W_{m}\rightarrow V_{n}^{\sigma} }$ のことを、 ${ A }$ の ${ \sigma }$ -反傾（contragradient）と呼ぶ。

命題 ${ \sigma }$ -反傾は一意的に存在する。

（証明） ${ (y, Ax)_{\sigma} = (x, By)_{\sigma} = (x, Cy)_{\sigma} }$ とすると、 ${ (x, (B-C)y)_{\sigma}=0 }$ が常に成り立つ。任意の ${ x\in V_{n} }$ で成り立つので、 ${ (B-C)y=0 }$ でなければならない。これが任意の ${ y\in W_{m} }$ で成り立つことから ${ B=C }$ が従うので一意性が分かる。また ${ V_{n}, W_{m} }$ の基底 ${ B_{n}=\lbrace v_{1}, \dotsc, v_{n} \rbrace, B_{m}=\lbrace w_{1}, \dotsc, w_{m} \rbrace }$ を取り、 ${ A }$ の ${ (B_{n}, B_{m}) }$ に関する行列表示を、記号の乱用を許して ${ A=(a_{ij}) }$ と置く。すると ${ B=\sigma^{-1}A^{T}=( \sigma^{-1}(a_{ji}) ) }$ について、 ${ Bw_{i} = \sigma^{-1}(a_{i1})v_{1}^{\sigma}+\dotsb+\sigma^{-1}(a_{in})v_{n}^{\sigma} }$ であるから

${ \sigma( (v_{j}, Bw_{i})_{\sigma} ) = \sigma( Bw_{i}(v_{j}) ) = \sigma( \sigma^{-1}(a_{ij}) ) = a_{ij} }$

が成り立つ。故に

${ (\sum \eta_{i}w_{i}, A(\sum \xi_{j}v_{j}) )_{\sigma}=\sum \sigma(\eta_{i}\xi_{j})a_{ij}=(\sum \xi_{j}v_{j}, B(\sum \eta_{i}w_{i}) )_{\sigma} }$

となる。よって ${ B }$ は ${ A }$ の ${ \sigma }$ -反傾である。 ${ \square }$

行列 ${ A }$ について ${ A^{\sigma}:=\sigma^{-1}A^{T} }$ と書くことにする。また ${ \sigma }$ -一次変換 ${ A }$ の ${ \sigma }$ -反傾も ${ A^{\sigma} }$ と書く。

特に ${ W_{m}=V_{n}=V }$ のとき、 ${ \sigma }$ -一次変換 ${ A:V\rightarrow V^{\sigma} }$ のことを ${ \sigma }$ -双対変換と呼ぶ。また ${ \sigma }$ -双線型写像 ${ \langle\cdot, \cdot\rangle : V\times V^{\sigma}\rightarrow L }$ のことを ${ \sigma }$ -双一次形式と呼ぶ。

${ \sigma }$ -双対変換について、基底を変えると行列表示はどのように変化するだろうか。 ${ V }$ の基底 ${ B=\lbrace e_{1}, \dotsc, e_{n} \rbrace }$ を取り、その ${ \sigma }$ -双対基底を ${ B^{\sigma} }$ としよう。 ${ \lbrack e^{\prime}_{1}, \dotsc, e^{\prime}_{n} \rbrack = \lbrack e_{1}, \dotsc, e_{n} \rbrack P }$ としたとき、 ${ e^{\prime}_{j} }$ の ${ \sigma }$ -双対基底たちは ${ \lbrack e^{\prime\sigma}_{1}, \dotsc, e^{\prime\sigma}_{n} \rbrack = \lbrack e_{1}^{\sigma}, \dotsc, e_{n}^{\sigma} \rbrack Q }$ と表せる。この ${ Q }$ を求めるには、 ${ e^{\prime\sigma}_{i}(e_{j}) }$ を計算すればよい。実際 ${ e^{\prime\sigma}_{i}(e_{j}) = e^{\prime\sigma}_{i}( \sum_{k}P^{-1}_{kj}e^{\prime}_{k} ) = \sigma( P^{-1}_{ij} ) }$ であり、一方 ${ e^{\prime\sigma}_{i}(e_{j})=\sum_{k}\sigma( Q_{ki} )e_{k}^{\sigma}(e_{j})=\sigma( Q_{ji} ) }$ であるから、 ${ \sigma Q^{T}=\sigma P^{-1} }$ を得る。故に行列表示は ${ A^{\prime}=P^{T}A(\sigma P) }$ となる。

定理 ${ \sigma }$ -双対変換と ${ \sigma }$ -双一次形式は一対一に対応する。

（証明） ${ \sigma }$ -双対変換 ${ A:V\rightarrow V^{\sigma} }$ について、 ${ \langle x, y \rangle_{A}:=(x, Ay)_{\sigma}=\sigma( (y, A^{\sigma}x)_{\sigma} ) }$ は ${ \sigma }$ -双一次形式である。また ${ \sigma }$ -双一次形式 ${ \langle \cdot, \cdot \rangle }$ に対し、 ${ x\mapsto \langle \cdot, x \rangle }$ は ${ \sigma }$ -双対変換を定める。これらの対応は互いに逆を定める。 ${ \square }$

${ \sigma }$ -双対変換 ${ G }$ が ${ G^{\sigma}=G }$ を満たすとき、 ${ \sigma }$ -対称変換という。また ${ \sigma }$ -双一次形式 ${ \langle \cdot, \cdot \rangle }$ が ${ \langle x, y \rangle = \sigma( \langle y, x \rangle ) }$ を満たすとき、 ${ \sigma }$ -対称形式という。

系 ${ \sigma }$ -対称変換と ${ \sigma }$ -対称形式は、定理の対応で一対一に対応する。

（証明） ${ \sigma }$ -対称変換 ${ G^{\sigma}=G }$ に対しては、

${ \langle x, y \rangle_{G} = (x, Gy)_{\sigma} = \sigma( (y, G^{\sigma}x)_{\sigma} ) = \sigma( (y, Gx)_{\sigma} )=\sigma( \langle y, x \rangle_{G} ) }$

より ${ \sigma }$ -対称形式を定める。また逆に ${ \sigma }$ -対称形式 ${ \langle \cdot, \cdot \rangle }$ に対しては、 ${ G:x\mapsto \langle \cdot, x \rangle }$ について ${ (y, Gx)_{\sigma} = Gx(y)=\langle y, x \rangle=\sigma( \langle x, y \rangle) }$ であり、また ${ (y, Gx)_{\sigma}=\sigma( (x, G^{\sigma}y)_{\sigma} )=\sigma( G^{\sigma}y(x) ) }$ となる。よって ${ G^{\sigma}y=\langle \cdot, y \rangle = Gy }$ が従う。故に ${ G }$ は ${ \sigma }$ -対称変換となる。 ${ \square }$

行列表示を見てみると、 ${ G^{\sigma}=G }$ のとき

${ \begin{align*} P^{T}G\sigma P)^{\sigma} &=\sigma^{-1}(P^{T}G\sigma P)^{T}=\sigma^{-1}(\sigma P^{T}G^{T}P) \\ &= P^{T}\sigma^{-1}G^{T}\sigma^{-1}P = P^{T}G^{\sigma}\sigma^{-1}P \\ &= P^{T}G\sigma^{-1}P \end{align*} }$

となる。よって ${ \sigma }$ -対称行列（ ${ A^{\sigma}=A }$ を満たす）は、 ${ \sigma^{-1}=\sigma }$ のとき、基底の変換（ ${ \sigma }$ -合同変換）で ${ \sigma }$ -対称行列に移り合う。

以上より、 ${ \sigma^{-1}=\sigma }$ のときには、

${ \sigma }$ -双対変換 ${ \longleftrightarrow }$ ${ \sigma }$ -双一次形式 ${ \longleftrightarrow }$ 行列表示の ${ \sigma }$ -合同類

及び

${ \sigma }$ -対称変換 ${ \longleftrightarrow }$ ${ \sigma }$ -対称形式 ${ \longleftrightarrow }$ ${ \sigma }$ -対称行列の ${ \sigma }$ -合同類

という三位一体が得られる。

例えば体の拡大として ${ \mathbb{C}(X)/\mathbb{C} }$ を考えて、 ${ \sigma: X\mapsto 1-X }$ とすると上記の対応が作れる。

所感

今回の議論は線型代数のどんな教科書にも載っているような話。エルミート変換は色々な場面で現れるので、似たような理論が ${ \sigma }$ -変換でも行えると思う。いずれにせよ対称や歪対称といった話を、体の拡大という立場から統一的に議論できるので便利かなと思う。

追記： ${ \sigma }$ -線型は ${ \sigma }$ -半線型（semi-linear）とも呼ぶそうです。

2017-11-10

行列式の導出について

数学

だんだん日が短くなってきて、あぁ今年ももう終わりかと思うようになりました。夕日をぼんやり眺めていると、ふと「行列式ってなんだろう？」という疑問が湧いてきたのです。もちろん定義は頭に入っています。色んなやり方があり、様々な性質を示すことだって多分できます。でもその定義がどこから来るのかという疑問について、今まで一度たりとも考えたことはありませんでした。本やネットを調べてみました。しかし納得できる説明はありませんでした。強いて言えば、歴史的に長い時間を掛けて整理された式であるということが分かった位でした。なので自分で納得できる理解の仕方が欲しいなと思い、少し考えてみることにしました。

素朴な発想

行列論の源は、次の連立一次方程式を解く、ということにあったはずです。

${ \begin{align*} a_{11}x_{1} + \dotsb + a_{1n}x_{n} &= y_{1} \\ &\vdots \\ a_{m1}x_{1} + \dotsb + a_{mn}x_{n} &= y_{m} \end{align*} }$

これを ${ Ax=y }$ と書いたのがスタートラインであり、与えられた ${ y }$ に対して上の式を満たす ${ x }$ を求めるという問題が、過不足のない ${ n=m }$ のときに必ず解けるかが肝になります。

ひとまず解があることをすぐに判断できる簡単な状況から考えます。上三角の場合、つまり ${ i \gt j }$ なら ${ a_{ij}=0 }$ を満たすときを考えてみます。

${ \begin{align*} a_{11}x_{1} + &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}x_{2} + \dotsb + &a_{2n}x_{n} &= y_{2} \\ & & \vdots & \\ & &a_{nn}x_{n} &= y_{n} \end{align*} }$

このとき、もし ${ a_{11}\neq 0, \dotsc, a_{nn}\neq 0 }$ が成り立つならば、 ${ x_{n} }$ から順繰りに式を計算することで、件の問題は解けることが分かります。このことから、問題が可解であるかどうかを決定づける（determine）式として、

${ a_{11}a_{22} \dotsm a_{nn} }$

が妥当であることが分かります。今は形式的な議論なので、整域性などは深く考えないようにします。

一般的な行列式の定義

一般の連立方程式であっても上三角に変形できることは、数学科の学生に限らず、全ての大学生が等しく学ぶはずです。 ${ 1 }$ 行目の式を ${ a_{11}^{-1} }$ 倍して、各 ${ k }$ 行に ${ a_{k1} }$ 倍したものを加えることで、 ${ 2 }$ から ${ n }$ 行目の式から ${ x_{1} }$ を「消去」できます。

${ \begin{align*} a_{11}x_{1} +a_{12}x_{2} &+\dotsb=y_{1} \\ (a_{22}-a_{21}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{2}-a_{21}a_{11}^{-1}y_{1} \\ &\vdots \\ (a_{n2}-a_{n1}a_{11}^{-1}a_{12})x_{2} &+\dotsb=y_{n}-a_{n1}a_{11}^{-1}y_{1} \end{align*} }$

ここで ${ 2 }$ 行目以降に着目してみます。

${ a_{ij}^{( 1 )}:=a_{ij}-a_{i1}a_{11}^{-1}a_{1j}, \quad y_{j}^{( 1 )}:=y_{j}-a_{j1}a_{11}^{-1}y_{1} }$

と置くことで得られる

${ \begin{align*} a_{22}^{( 1 )}x_{2} + \dotsb + a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ &\vdots \\ a_{n2}^{( 1 )}x_{2} + \dotsb + a_{nn}^{( 1 )}x_{n} &= y_{n}^{( 1 )} \end{align*} }$

についても同様な操作を行ってみます。再び

${ a_{ij}^{( s )}:=a_{ij}^{( s-1 )}-a_{is}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}a_{sj}^{( s-1 )},\quad y_{j}^{( s )}:=y_{j}^{( s-1 )}-a_{js}^{( s-1 )}(a_{ss}^{( s-1 )})^{-1}y_{s}^{( s-1 )} }$

と置けば、結局

${ \begin{align*} a_{11}x_{1} + &a_{12}x_{2} + \dotsb + &a_{1n}x_{n} &= y_{1} \\ &a_{22}^{( 1 )}x_{2} + \dotsb + &a_{2n}^{( 1 )}x_{n} &= y_{2}^{( 1 )} \\ & & \vdots & \\ & &a_{nn}^{( n-1 )}x_{n} &= y_{n}^{( n-1 )} \end{align*} }$

という上三角行列を得ることができます。

先の素朴な考察を思い出せば、一般的な行列に対しては

${ \mathrm{det}A:=a_{11}a_{22}^{( 1 )} \dotsm a_{nn}^{( n-1 )} }$

を計算すれば良いと分かります。

可換の場合

可換性を仮定して少し計算してみると、馴染みの深い式が出てきます。

${ n=1 }$ のときは ${ a_{11} }$ です。

${ n=2 }$ のときは ${ a_{11}a_{22}^{( 1 )}=a_{11}(a_{22}-a_{21}a_{11}^{-1}a_{12})=a_{11}a_{22}-a_{21}a_{12} }$ です。

${ n=3 }$ を気合いで計算すると、

${ \begin{align*} a_{11}a_{22}a_{33}-a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33} \\ -a_{11}a_{23}a_{32}+a_{13}a_{21}a_{32}+a_{12}a_{23}a_{31} \end{align*} }$

となります。

式の形から、次の予想が成り立ちます。

定理可換性を仮定すれば、

$\mathrm{det}A=\sum_{\sigma\in S_{n}} \mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )}$

が成り立つ。ただし ${ \sigma\in S_{n} }$ は ${ n }$ 文字の置換全体を動く。

（証明） ${ n }$ に関する帰納法で示す。まず

$\mathrm{det}A=a_{11}\mathrm{det}\left(\begin{matrix}a_{22}^{( 1 )} & \cdots & a_{2n}^{( 1 )} \\ \vdots & & \vdots \\ a_{n2}^{( 1 )} & \cdots & a_{nn}^{( 1 )} \end{matrix}\right)$

であるから、帰納法の仮定より

$\mathrm{det}A=a_{11}\sum_{\sigma}\mathrm{sgn}\sigma\cdot a_{2\sigma( 2 )}^{( 1 )}\dotsm a_{n\sigma( n )}^{( 1 )}$

が従う。和を前に出すと、中身は

$\sum_{S\subset\lbrace 2, 3, \dotsc, n \rbrace}\mathrm{sgn}\sigma\cdot (a_{11}^{-1})^{n-2}\prod_{i\in S}a_{11}a_{i\sigma( i )}\prod_{j\notin S}(-1)a_{j1}a_{1\sigma( j )}$

となる。もし異なる ${ j, k\notin S }$ があれば、 ${ \tau:=\langle j, k \rangle\sigma }$ とすると、 ${ i\neq j, k }$ に対して ${ \sigma( i )=\tau( i ) }$ だから、符号のみがずれて、お互いに打ち消し合ってしまう。故に

$\mathrm{det}A=\sum_{\sigma}\mathrm{sgn}\sigma \left\lbrace a_{11}a_{2\sigma( 2 )}\dotsm a_{n\sigma( n )}-\sum_{i=2}^{n}a_{1\sigma( i )}a_{2\sigma( 2 )}\dotsm a_{i1} \dotsm a_{n\sigma( n )} \right\rbrace$

を得る。前は添え字 ${ 1 }$ に関係しない部分、後ろは添え字の ${ 1 }$ と ${ i }$ を互換したものに相当するから、これは

$\sum_{\sigma\in S_{n}}\mathrm{sgn}\sigma\cdot a_{1\sigma( 1 )}\dotsm a_{n\sigma( n )}$

に等しい。 ${ \square }$

まとめ

上記の考察から、連立方程式の可解性を決定する式という素朴な発想から、行列式の通常の定義を導くことができました。いつも天下り的に定義するのが不満だったのですが、一応納得できそうな屁理屈を述べることができたのではないかと思います。帰納的定義など、他の方法でもこのような意味付けができるかは不明です。

2017-10-18

重み付き余代数グラフ（weighted graph coalgebra）

数学

以前「余代数のグラフ表現について」という記事を書いた。

arxiv.hatenablog.com

最後の方に述べた注意で、例4に挙げたdivided power coalgebraはグラフ余代数（またはその剰余）として表すことが出来ない（知られていない）が、適切な重みを付けてやれば良いだろうと書いた。最近になって真面目に計算してみたら、2変数の重み付けではダメで3変数にしたらいい感じになったので報告しておく。

グラフ余代数

まず簡単なおさらいから始めよう。

${ R }$ は可換環とする。 ${ i\in I }$ を頂点とする有向グラフ ${ \Gamma }$ は反射的（ ${ i\rightarrow i }$ ）かつ推移的（ ${ i\rightarrow j, j\rightarrow k }$ なら ${ i\rightarrow k }$ ）かつ局所有限（ ${ \sharp\lbrace k : i\rightarrow k\rightarrow j \rbrace \lt \infty }$ ）であるとする。辺 ${ e_{ij} }$ の自由加群 ${ C:=\bigoplus Re_{ij} }$ において、

$\Delta (e_{ij}):=\sum_{i\rightarrow k\rightarrow j}e_{ik}\otimes e_{kj}$

及び ${ \epsilon(e_{ij})=\delta_{i, j} }$ と定めると組 ${ (C, \Delta, \epsilon) }$ は余代数を定める。即ち

${ \begin{align*} \Delta\otimes\mathrm{id}\circ\Delta=\mathrm{id}\otimes\Delta\circ\Delta, \\ \epsilon\otimes\mathrm{id}\circ\Delta=(C\xrightarrow{\cong} R\otimes C), \\ \mathrm{id}\otimes\epsilon\circ\Delta=(C\xrightarrow{\cong} C\otimes R) \end{align*} }$

が成り立つ。この余代数をグラフ余代数と呼ぶ。

一方のdivided power coalgebraとは ${ C=\oplus_{n\ge 0}Rd_{n} }$ として、

$\Delta(d_{n})=\sum_{k=0}^{n}\left(\begin{matrix}n \\ k\end{matrix}\right)d_{k}\otimes d_{n-k}$

及び ${ \epsilon(d_{n})=\delta_{n, 0} }$ はクロネッカーのデルタ、と定めたものだ。係数が違うのでグラフ余代数ではない。

重み付きグラフ余代数（weighted graph coalgebra）を以下で定めよう。「重み」とは ${ i\rightarrow k\rightarrow j }$ に対する ${ \gamma_{ikj}\in R }$ のことである。

定理重み ${ \lbrace \gamma_{abc} \rbrace }$ は以下の条件を満たすとする。

${ \begin{align*} \gamma_{abc}\gamma_{acd}&=\gamma_{abd}\gamma_{bcd} \quad (a\rightarrow b\rightarrow c\rightarrow d) \\ \gamma_{iij}&=\gamma_{ijj}=1 \end{align*} }$

このとき

$\begin{align*} \Delta(e_{ij})&:=\sum_{i\rightarrow k\rightarrow j}\gamma_{ikj}e_{ik}\otimes e_{kj}, \\ \epsilon(e_{ij})&=\delta_{i, j} \end{align*}$

は余代数を定める。

定義上記を重み付きグラフ余代数と呼ぶ。

例えば先ほどのdivided power coalgebraは、 ${ i \le j }$ について ${ i\rightarrow j }$ としたときの、

$\gamma_{abc}=\frac{(c-a)!}{(b-a)!(c-b)!}$

による重み付きグラフ余代数である。

数論的関数に関する例

最近、数論的関数について調べていたのもあり、面白そうな例を思いついた。

${ \mathbb{N}=\lbrace 1, 2, 3, \dotsc \rbrace }$ について ${ d|n }$ のとき ${ d\rightarrow n }$ と定める。これは推移的かつ局所有限である。今 ${ R=\mathbb{C} }$ とし、数論的関数 ${ f:\mathbb{N}\rightarrow\mathbb{C} }$ による重み付けを考えたい。重みを

$\gamma_{abc}:=e^{f(c/a)-f(b/a)-f(c/b)}$

と定めると、上記の条件を満たすには ${ f(1)=0 }$ であればよい。つまりconvolutionで可逆でない数論的関数に対し、重み付けグラフ余代数が定義できる。

もちろん重みの付け方は他にもあるだろう。いずれにせよ（重み付け）グラフ余代数は例が非常に豊富なので、何か新しいことができる予感はある。「こんな結果があるよ」というのがあれば、コメントなり表示名 - Mathtodonなりで是非教えてください。

arXiv探訪

興味の赴くままに数学するだけ

線型写像のちょっとした拡張について

${ \sigma }$ -線型写像

${ \sigma }$ -双対空間

${ \sigma }$ -双対変換と ${ \sigma }$ -双一次形式

所感

行列式の導出について

素朴な発想

一般的な行列式の定義

可換の場合

まとめ

重み付き余代数グラフ（weighted graph coalgebra）

グラフ余代数

数論的関数に関する例

-線型写像

-双対空間

-双対変換と-双一次形式

所感

素朴な発想

一般的な行列式の定義

可換の場合

まとめ

グラフ余代数

数論的関数に関する例

${ \sigma }$ -線型写像

${ \sigma }$ -双対空間

${ \sigma }$ -双対変換と ${ \sigma }$ -双一次形式