从张量积到泛性质

1 Constructions of the Tensor Product

本文只考虑\(\R\)-线性空间.

先来回顾一下线性空间的直和(direct sum). 两个线性空间\(V,W\)的直和记作\(V\oplus W\), 它本质上就是笛卡尔积\(V\times W=\qty{(v,w)\,|\,v\in V,w\in W}\), 并且赋予如下线性结构: \[ \Align{ (v_1,w_1)+(v_2,w_2) &= (v_1+v_2,w_1+w_2), \\ k(v,w) &= (kv,kw), \quad k\in\R. } \]\((v,w)\)记作\(v\oplus w\), 可以发现"直和"的确有加法的特征, 比如

  • "分配律", \(k(v\oplus w)=(kv)\oplus(kw)\);
  • "结合律"不过这和一般的加法结合律不同, 因为\(\oplus\)​和\(+\)​是两种不同的运算, 所以这只是形式上的结合律.[1], \((v_1\oplus w_1)+(v_2\oplus w_2)=(v_1+v_2)\oplus(w_1+w_2)\);

以及维数关系\(\dim(V\oplus W)=\dim{V}+\dim{W}\).

而张量积则是一种类似于乘法的操作. 两个向量\(v\in V,w\in W\)的张量积(tensor product)记作\(v\otimes w\). 依据"乘法"的特点, 我们对\(\otimes\)作一些要求:

  • "分配律", \((v_1+v_2)\otimes w=v_1\otimes w+v_2\otimes w\), \(v\otimes(w_1+w_2)=v\otimes w_1+v\otimes w_2\);
  • "结合律"这也是形式上的结合律.[2], \((kv)\otimes w=k(v\otimes w)=v\otimes(kw)\), 对任意\(k\in\R\).

换句话说, \(\otimes\)双线性(bilinear)的. 线性空间\(V,W\)的张量积空间记作\(V\otimes W\), 我们希望它也是一个线性空间, 而且\(\dim(V\otimes W)=\dim V\dim W\).

下面我们先介绍几个张量积的具体实现方法(构造性定义), 再从中提取出张量积的核心特征, 借此来给出张量积的另一种定义方法.

1.1 As a quotient space

两个线性空间的张量积\(V\otimes W\)可以通过它们的笛卡尔积\(V\times W\)构造出来. 对线性空间\(V,W\), 记 \[ F(V\times W):=\left\{ \sum\nolimits_{(v,w)\in V\times W} \alpha_{v,w}(v,w) \,\middle|\, \alpha_{v,w}\in\R,\textsf{只有有限个非零}\alpha_{v,w} \right\}, \] 称为\(V\times W\)生成的自由线性空间(free vector space), 也就是把\(V\times W\)当作一个基底生成的线性空间. 然而\(F(V\times W)\)不是最终结果, 我们希望张量积是双线性的, 所以应当认同 \[ \Align{ (v_1+v_2,w) &\sim (v_1,w)+(v_2,w), \\ (v,w_1+w_2) &\sim (v,w_1)+(v,w_2), \\ (kv,w) &\sim k(v,w), \\ (v,kw) &\sim k(v,w). \\ }\label{quotient}\tag{a} \] 更正式地说, 设子空间 \[ \Align{S={} &{\rm span}\qty{(v_1+v_2,w)-(v_1,w)-(v_2,w)\,|\,v_1,v_2\in V,w\in W}+{} \\ &{\rm span}\qty{(v,w_1+w_2)-(v,w_1)-(v,w_2)\,|\,v\in V,w_1,w_2\in W}+{} \\ &{\rm span}\qty{(kv,w)-k(v,w)\,|\,v\in V,w\in W,k\in\R}+{} \\ &{\rm span}\qty{(v,kw)-k(v,w)\,|\,v\in V,w\in W,k\in\R}, } \]\(V\otimes W=F(V\times W)/S\). 把\((v,w)\in F(V\times W)\)所在等价类 \[ [v,w]\equiv(v,w)+S \] 记作\(v\otimes w\). 可以证明, 映射\((v,w)\mapsto[v,w]=v\otimes w\)是双线性的: \[ \Align{ [kv_1+v_2,w] &=(kv_1+v_2,w)+S \\ &=k(v_1,w)+(v_2,w)+S \\ &=k[v_1,w]+[v_2,w]. } \] (其中第一, 三个等号由商空间上线性运算的定义设线性空间V的线性子空间U, 则商空间为\(V/U:=\qty{v+U\,|\,v\in V}\), 配以线性运算\((v_1+U)+(v_2+U):=(v_1+v_2)+U, k(v+U):=(kv)+U\). 向量\(v,w\in V\)等价当且仅当\(v-w\in U\).[3]; 第二个等号根据等价关系.)

1.2 From bases

\(V\)的基底\(B_V=\qty{e_i}_{i\in I}\), \(W\)的基底\(B_W=\qty{f_j}_{j\in J}\).

对于\(v=\sum v_ie_i\in V\), \(w=\sum w_je_j\in W\), 其张量积可以借助基底定义为 \[ v\otimes w = \sum_{i,j} v_iw_j\,e_i\otimes f_j. \] 如此定义的\(\otimes\)关于\(v,w\)都是线性的.

张量积空间\(V\otimes W\)是形如\(v\otimes w=\sum \alpha_{i,j}e_i\otimes f_j\)的元素张成的线性空间: \[ V\otimes W = \left\{ \sum_{i,j}\alpha_{i,j}e_i\otimes f_j \,\middle|\, \alpha_{i,j}\in\R \right\}. \] 可以发现, \(V\otimes W\)的一个基底是\(\qty{e_i\otimes f_j}_{i\in I,j\in J}\), 所以\(\dim(V\otimes W)=\dim{V}\dim{W}\).

\(V\otimes W\)的加法和数乘自然地定义为 \[ \Align{ \pqty{\sum\alpha_{i,j}e_i\otimes f_j}+ \pqty{\sum\beta_{i,j}e_i\otimes f_j} &:= \sum (\alpha_{i,j}+\beta_{i,j}) e_i\otimes f_j, \\ k\pqty{\sum\alpha_{i,j}e_i\otimes f_j} &:= \sum (k\alpha_{i,j}) e_i\otimes f_j, \quad k\in\R. \\ } \]

1.3 *Tensors as multilinear maps

因为\(V\)\(V^{**}\)自然同构, 所以\(V\)中的向量可以看作是线性映射\(v:V^*\to\R\); 同样, \(W\)中的向量也可看作线性映射\(w:W^*\to\R\). 进而, 我们定义\(v,w\)的张量积\(v\otimes w\)为双线性映射\(V^*\times W^*\to\R\), \[ (v\otimes w)(f,g) := v(f)w(g),\quad\forall f\in V^*,g\in W^*, \] 就是将两个线性映射放在一起的结果. 将所有双线性映射\(v\otimes w\)组成的集合记作\(V\otimes W\). 由上可知, \(\otimes\)是双线性的: (仅列出关于\(v\)的线性性, 关于\(w\)的线性性同理) \[ \Align{ (\alpha v\otimes w)(f,g) &= \alpha v(f)w(g) = \alpha(v\otimes w)(f,g), \\ ((v_1+v_2)\otimes w)(f,g) &= (v_1+v_2)(f)w(g) \\ &= v_1(f)w(g) + v_2(f)w(g) \\ &= (v_1\otimes w)(f,g) + (v_2\otimes w)(f,g). } \]

2 Universal Property of the Tensor Product

2.1 The universal property definition

前面我们提到过, 张量积的"乘法"特征就是其双线性性. 下面我们说明, 在所有这些"乘法"中, 张量积是最一般的那个, 它保留了最多的线性结构.

线性空间上的乘法(multiplication)指的是双线性映射\(\mu:V\times W\to Y\)(其中\(V,W,Y\)都是线性空间). 张量积\(\otimes:V\times W\to Y\)除了双线性性之外并无其他要求, 因此可以看作是"最一般"的乘法, 它保留了\(V,W\)最多的线性结构, 因而所有从\(V\times W\to Z\)的双线性映射都可以借由\(\otimes\)来表示.

  • 这个性质称为张量积的泛性质(universal property).

我们自然会有个问题: 张量积的泛性质是否可以用来定义张量积? 答案是肯定的.

  • 如果可以找到一种通过性质定义对象的方法, 就可以免去具体构造的繁琐细节, 使得定义变得简洁而直击本质.
  • 尽管这种定义可能会比较抽象, 难以理解, 但是定义的动机是清晰的.

下面我们给出张量积的定义(通过泛性质). 张量积指的是一个有序对\((\varphi,Y)\), 其中\(\varphi:V\times W\to Y\)是双线性映射, 满足: 对于任意双线性映射\(h:V\times W\to Z\), 都唯一存在线性映射\(\tilde{h}:Y\to Z\), 使得 \[ \tilde{h}\circ\varphi = h, \] 即有交换图 \[ \xymatrix{ V\times W \ar[r]^-{\varphi} \ar[rd]_{h} & Y \ar@{.>}[d]^(0.4){\tilde h} \\ & Z. } \]

  • 一般将\(\varphi(v,w)\)记作\(v\otimes w\), 将\(Y\)记作\(V\otimes W\).
  • 任意一个双线性映射\(V\times W\to Z\)都可以借助张量积变为一个线性映射.

首先应当验证, 前几节的构造性定义确实满足上面的泛性质定义. 这里以商空间构造(1.1)为例.

Pf 商空间构造中, \(\varphi:V\times W\to F(V\times W)/S\). 任取双线性映射\(h:V\times W\to Z\), 定义一个映射\(\tilde{h}:F(V\times W)/S\to Z\)满足\(\tilde{h}\circ\varphi=h\). 先对\([v,w]\in F(V\times W)/S\)定义 \[ \tilde{h}([v,w]) := h(v,w), \] 可以利用\(F(V\times W)/S\)线性运算把上述定义拓展到整个\(F(V\times W)/S\)上: \[ \tilde{h}\pqty{\bqty{\sum\alpha_{v,w}(v,w)}} := \sum\alpha_{v,w}h(v,w). \] 先证明\(\tilde{h}\)是良定义的, 只需证\([v,w]\sim[v',w']\Rightarrow\tilde{h}([v,w])=\tilde{h}([v',w'])\). 任取\([v,w]\sim[v',w']\), 则\((v,w),(v',w')\)必然满足\((\ref{quotient})\)式中的任意一条等价关系, 根据\(h\)的双线性性, \(h(v,w)=h(v',w')\), 即\(\tilde{h}([v,w])=\tilde{h}([v',w'])\).

其次证明\(\tilde{h}\)是线性的. 任取\([v,w],[v',w']\)以及\(\lambda\in\R\), 则 \[ \tilde{h}(\lambda[v,w]) =\tilde{h}([\lambda v,w]) =h(\lambda v,w) =\lambda h(v,w) =\lambda\tilde{h}([v,w]), \] (第一个等号根据\(\lambda(v,w)\sim(\lambda v,w)\); 第三个等号根据\(h\)的双线性性.) 以及 \[ \Align{ \tilde{h}([v,w]+[v',w']) &=\tilde{h}([(v,w)+(v',w')]) \\ &=h(v,w)+h(v',w') \\ &=\tilde{h}([v,w])+\tilde{h}([v',w']). } \] (第一个等号利用了等价类的性质; 第二个等号利用了\(\tilde{h}\)在整个\(F(V\times W)/S\)上的定义.)

最后说明\(\tilde{h}\)是唯一的. 条件\(\tilde{h}\circ\varphi=h\)使得\(\tilde{h}([v,w])\)的定义是唯一的, 而\(\qty{[v,w]}_{v\in V,w\in W}\)必定包含了\(F(V\times W)/S\)的一个基底, 因此将\(\tilde{h}\)延拓到\(F(V\times W)/S\)的方式也是唯一的.

综上所述, 商空间构造满足张量积的泛性质, \((\varphi,F(V\times W)/S)\)构成张量积.

2.2 Existence and uniqueness

泛性质定义的张量积是存在的(构造性定义便是例子), 却不唯一. 但是, 所有张量积在同构意义下唯一(unique up to an isomorphism).

假设有两个张量积\((\varphi,Y)\)\((\varphi',Y')\). 对\(\varphi\)应用泛性质定义(将\(\varphi'\)视作\(h\)), 存在线性映射\(\tilde{h}:Y\to Y'\), \(\tilde{h}\circ\varphi=\varphi'\). 同理, 对\(\varphi'\)应用泛性质定义, 存在线性映射\(\tilde{h}':Y'\to Y\), \(\tilde{h}'\circ\varphi'=\varphi\). 所以有交换图 \[ \xymatrix@C=30pt@R=10pt@L=0.5pt{ & Y \ar@<2pt>@{.>}[dd]^{\tilde{h}} \\ V\times W \ar[ru]^{\varphi} \ar[rd]_{\varphi'} \\ &Y' \ar@<2pt>@{.>}[uu]^{\tilde{h}'} } \] 因此, \(\tilde{h}\)\(\tilde{h}'\)是一对互逆的线性映射, 进而都是线性同构. 这说明作为线性空间, \(Y\cong Y'\), 而且由\(\tilde{h},\tilde{h}'\)的唯一性知(保持张量积的)同构映射是唯一的.

根据张量积在同构意义下的唯一性, 前文的几个构造都是同构的, 进而\(V\otimes W\)的维数是确定的. 根据1.2有 \[ \dim(V\otimes W)=\dim{V}\dim{W}. \]

2.3 Examples and counterexamples

先举出几个满足张量积泛性质的例子.

张量积的非零常数倍. 设\(\otimes:V\times W\to Y\)构成张量积, 则\(\varphi:V\times W\to Y\), \((v,w)\mapsto kv\otimes w\)(\(k\neq0\))也构成张量积.

矩阵的Kronecker乘积. 以\(2\times2\)矩阵为例. 矩阵\(\vb{A}=\pmqty{a_{11}&a_{12}\\a_{21}&a_{22}},\vb{B}=\pmqty{b_{11}&b_{12}\\b_{21}&b_{22}}\)的Kronecker乘积定义为 \[ \vb{A\otimes B} :=\pmqty{a_{11}\vb{B}&a_{12}\vb{B}\\a_{21}\vb{B}&a_{22}\vb{B}} =\pmqty{ a_{11}b_{11} & a_{11}b_{12} & a_{12}b_{11} & a_{12}b_{12} \\ a_{11}b_{21} & a_{11}b_{22} & a_{12}b_{21} & a_{12}b_{22} \\ a_{21}b_{11} & a_{21}b_{12} & a_{22}b_{11} & a_{22}b_{12} \\ a_{21}b_{21} & a_{21}b_{22} & a_{22}b_{21} & a_{22}b_{22} }. \] 可以验证, Kronecker积是双线性映射\(\R^{2\times2}\times\R^{2\times2}\to\R^{4\times4}\), 并且满足张量积的泛性质.

下面我们再举几个不构成张量积例子, 感受一下泛性质定义是怎样排除我们不想要的东西的.

直和. 直和\(\varphi:(v,w)\mapsto v\oplus w\)不构成张量积, 因为\(\varphi\)不是双线性的.

自由线性空间. 包含映射\(\varphi:V\times W\to F(V\times W)\)不构成张量积, 因为\(\varphi\)不是双线性的. (然而, 如果将\(F(V\times W)\)中的某些元素认同起来, 就可以把\(\varphi\)变成双线性的, 如1.1节所述).

楔积. 取\(\varphi:V\times V\to Y\), \((v_1,v_2)\mapsto v_1\wedge v_2\). 任给双线性\(h:V\times V\to Z\), 假设存在线性映射\(\tilde{h}:Y\to Z\), 使得\(\tilde{h}(v\wedge w)=h(v,w)\), 则根据楔积的反对称性有 \[ h(v,w) = \tilde{h}(v\wedge w) = \tilde{h}(-w\wedge v) =-\tilde{h}(w\wedge v) =-h(w,v), \] 这意味着\(h\)也是反对称的, 对于一般的\(h\)显然是不成立的.

  • 矛盾的原因是楔积\(\wedge\)附加了额外的"反对称"性质.
  • 实际上, 楔积的泛性质是"任意一个反对称的双线性映射\(f:V\times V\to Z\)都可以借助楔积唯一地表示为一个线性映射\(\tilde{f}:Y\to Z\)."

双线性形式. 取双线性函数\(\varphi:V\times W\to\R\)(也称双线性形式).任给双线性\(h:V\times W\to Z\), 假设存在线性映射\(\tilde{h}:\R\to Z\), 使得\(\tilde{h}(\varphi(v,w))=h(v,w)\). 实际上很快就能得出矛盾, 因为\(\tilde{h}\)是从\(\R\)的线性映射, 所以\(\im\tilde{h}\)的维数至多是\(1\), 然而(一般来说)\(\im{h}\)的维数可以是\(0\)\(\dim{V}+\dim{W}\)的任意值.

  • 矛盾的原因是\(\varphi:V\times W\to\R\)压缩了维数, 损失了一部分线性结构.

综上看来, 泛性质定义的张量积是一个足够"一般"的双线性乘法, 既保持了\(V,W\)的线性结构, 又没有引入其他结构.

3 The Universal Property

下面简单地介绍一下一般情况下泛性质的定义. 需要一定范畴论基础, 可以参考Paolo Aluffi §I.3, §I.4.

3.1 Terminal objects

回顾张量积的泛性质: 张量积指的是一个有序对\((\varphi,Y)\), 其中\(\varphi:V\times W\to Y\)是双线性映射, 其泛性质指的是: 对于任意双线性映射\(h:V\times W\to Z\), 都唯一存在线性映射\(\tilde{h}:Y\to Z\), 使得下图交换: \[ \xymatrix{ V\times W \ar[r]^-{\varphi} \ar[rd]_{h} & Y \ar@{.>}[d]^(.4){\tilde h} \\ & Z. } \]

现在我们丢掉与张量积有关的信息, 只保留"泛性质"的骨架: 称一个有序对\((\varphi:A\to Y,Y)\)满足泛性质, 如果对任意态射\(h:A\to Z\), 都唯一存在态射\(\tilde{h}:Y\to Z\), 使得下图交换: \[ \xymatrix{ A \ar[r]^{\varphi} \ar[rd]_{h} & Y \ar@{.>}[d]^(.4){\tilde h} \\ & Z. } \] 为了进一步严格化泛性质的定义, 先给出一些概念.

在范畴\(\sf{C}\)中, 称一个对象\(I\)始对象(initial object), 如果对任意\(\sf{C}\)对象\(A\), 都唯一存在态射\(I\to A\); 称一个对象\(F\)终对象(final object), 如果对任意\(\sf{C}\)对象\(A\), 都唯一存在态射\(A\to F\).

  • 一个范畴\(\sf{C}\)不一定始对象或终对象, 但是如果存在的话, 它们分别在同构意义下唯一(类比前文对张量积在同构意义下唯一的证明).

如果一个对象是某个范畴的始对象或终对象, 那么称它满足某种泛性质, 即"对任意态射..., 都存在唯一的态射..., 使得下图...交换".

3.2 Products and coproducts

最后我们通过泛性质定义两个重要的构造.

两个对象\(A,B\)积(product)\({\sf C}_{A,B}\)中的一个始对象\((X,\pi_A,\pi_B)\), 即 \[ \xymatrix@C=20pt@R=5pt@L=0.5pt{ & A \\ X \ar[ru]^-{\pi_A} \ar[rd]_-{\pi_B} \\ & B } \] 而且对任意\((Z,f_A,f_B)\), 都唯一存在态射\(\sigma:Z\to X\), 使得下图交换: \[ \xymatrix@C=20pt@R=5pt@L=0.5pt{ && A \\ Z \ar@/^10pt/[rru]^{f_A} \ar@/_10pt/[rrd]_{f_B} \ar@{.>}[r]^-{\sigma} & X \ar[ru]^{\pi_A} \ar[rd]_{\pi_B} \\ && B } \]

将积的箭头反转就得到了余积(coproduct)的定义, 简而言之 \[ \xymatrix@C=20pt@R=5pt@L=0.5pt{ && A \ar@/_10pt/[lld]_{f_A} \ar[ld]_{\iota_A} \\ Z & X \ar@{..>}[l]_(0.4){\sigma} \\ && B \ar@/^10pt/[llu]^{f_B} \ar[lu]^{\iota_B} } \]

Example 集合范畴\(\sf Set\)\(A,B\)的积是笛卡尔积\(A\times B\), 余积是无交并\(A\amalg B\).

\(\R\)线性空间范畴\(\sf{Vect}_\R\)\(V,W\)的积和余积都是直和\(V\oplus W\).

考虑这样一个范畴\({\sf C}\), 它的对象是所有整数, 如果两个对象\(m\leq n\), 那么恰好存在一个态射\(m\to n\). 在这个范畴中,

  • \(m,n\)的积是两数的较大者\(\min\qty{m,n}\),
  • \(m,n\)的余积是两数的较小者\(\max\qty{m,n}\).

  1. 不过这和一般的加法结合律不同, 因为\(\oplus\)​和\(+\)​是两种不同的运算, 所以这只是形式上的结合律.↩︎

  2. 这也是形式上的结合律.↩︎

  3. 设线性空间V的线性子空间U, 则商空间为\(V/U:=\qty{v+U\,|\,v\in V}\), 配以线性运算\((v_1+U)+(v_2+U):=(v_1+v_2)+U, k(v+U):=(kv)+U\). 向量\(v,w\in V\)等价当且仅当\(v-w\in U\).↩︎


从张量积到泛性质
https://disembo.github.io/Note/tensor-products-and-universal-properties/
作者
jin
发布于
2023年9月11日
许可协议