复数与变换

推荐:Visualizing Complex Analysis by Tristan Needham.(《复分析可视化方法》尼达姆著.)

数学在某方面类似于考古学. 你也许会找到某个东西的一角,并由此判断它是有趣的. 于是你开始在别处挖掘,又找到了非常相似的另一角,你会想,是否有更深的联系?你继续挖掘,最终发现了地下的结构. 当某些东西最终表明有意义时,你有一种发现的激动.

——陶哲轩

很多数学问题看似毫无关联,或者似乎有关联却无法理论解释. 但是若站在更高、更抽象和更一般的角度上往往能发现它们之间的关联.

1 复数的引入

方程求根是数学研究中一个非常核心的问题了,它催生出了许多新的数学分支. 在实数域内,不是所有的二次方程都有根,例如\(x^2=-2\)​,没有任何一个实数的平方是负数. 而对于三次方程,在使用求根公式求根的过程中,即使系数和根都是实数,也会不可避免地遇到负数开平方的问题.

Tartaglia公式给出了形式为\(x^3=px+q\)​​的三次方程的解,例如\(x^3=x\),解为 \[ \dfrac1{\sqrt3}\pqty{\pqty{\sqrt{-1}}^{1/3}+\pqty{\sqrt{-1}}^{-1/3}} \]

如此看来,我们必须认真面对负数开平方问题. 一个想法是定义一些新的数,这些数的平方是负数,但是它们肯定无法用无限小数的形式表示(实数和无限小数一一对应),看起来"子虚乌有",所以命名为"虚数",定义虚数单位\(\i:\i^2=-1\)​.

"实数(Real numbers)"和"虚数(Imaginary numbers)"两个名字都是Descartes起的.

实数单位是\(1\)​​​​,虚数单位是\(\i\)​​​​,两者线性组合\(z=a+b\i(a,b\in\R)\)​​​​称为复数(Complex number),复数构成及集合称为复数集\(\C=\qty{z=a+b\i|a,b\in\R}\)​​.

可以发现,实数是一个一维的数域,它和直线上的点一一对应;复数是一个二维的数域,自然和平面上的点一一对应:\((a,b)\leftrightarrow a+b\i\)​​​. 称这个平面为复平面(Complex plane). 复平面的横轴称为实轴,纵轴称为虚轴.

点的横坐标\(a\)称为\(z\)的实部(Real part),纵坐标\(b\)称为\(z\)的虚部(Imaginary part),记作\(a=\Re(z),b=\Im(z)\),注意实部和虚部都是实数. 对于一个复数\(z\),如果虚部为\(0\),那么\(z\)就是实数(对应实轴);如果实部为\(0\)且虚部不为\(0\),那么\(z\)称为纯虚数(对应虚轴去掉原点).

实数\(x\)​的绝对值是\(x\)​离数轴原点的距离,类似地,复数\(z\)​的(Modulus)是\(z\)离复平面原点的距离,记作 \[ |z|=|a+b\i|=\sqrt{a^2+b^2} \] > 复数是二维的,不能比较大小,但是它们的模可以比较大小.

把非零复数\(z\)对应的向量和正实轴的的夹角称为辐角(Argument),记作\(\Arg z\)\(z\)的辐角显然有无穷多个,之间相差\(2\pi\)的整数倍. 把那个在\((-\pi,\pi]\)的辐角称为辐角主值(Principal value of argument),记作\(\arg{z}\).

如果\(z=0\),那么\(z\)的辐角\(\Arg{0}\)是任意的,\(\arg{0}\)没有意义.

复共轭(Complex conjugate):复数\(z=a+b\i(a,b\in\R)\)的共轭复数是\(\overline{z}=a-b\i\),它们两个在复平面中关于实轴对称.

* 关于复变函数

刚才提到了复数的辐角:给定\(z\in\C\setminus\qty{0}\),有唯一确定的辐角主值\(\arg{z}\),所以\(\arg\)是一个函数;而\(z\)的辐角有无穷多个,如果记为\(\Arg{z}\)的话,\(\Arg\)不是一个函数.

但是,如果我们拓展函数的概念,允许有一个或多个确定的值与自变量对应,并将这种函数称为多值函数(Multivalued function),那么\(\Arg\)就是一个多值函数. 与之对应的是单值函数,如\(\arg\).

可以理解为,多值函数把一个值对应到了一个数集,\(\Arg z=\qty{\arg z+2k\pi|k\in\Z}\).

\(\arg\)\(\Arg\)都是以复数为自变量的函数,给这种函数一个定义:

复变函数(Complex function)指的是以复数作为自变量和因变量的函数(与之相应的是实变函数).

下面几节要讨论的复变函数一部分是多值的,而这归根到底就是因为辐角函数是多值的.

实变函数\(y=f(x)\)的自变量和因变量都是一维的,可以在二维\(xOy\)平面上以\((x,y)\)画出它的图像.

复变函数\(w=f(z)\)的自变量和因变量都是二维的,若要同时表示自变量和因变量,需要在四维的坐标系中,我们难以构建. 所以人们想出了别的方法,把四个自由度在二维或三维空间中表现出来:

  • 模-辐角图:给复平面上每个点都涂上颜色,色相和明暗表示这一点函数值的辐角和模.

    • 还有3D版的:在空间坐标系画出\(w=|f(z)|\)的图像曲面,再用颜色表示辐角.

      下面给出了函数\(f(z)=z\)的图像模-辐角图:

      这两幅图把从\(-\pi\)\(\pi\)的辐角主值涂上了从蓝色到红色再到绿色的颜色.

      左图给出了辐角的等值线(从原点出发的射线)和模的等值线(同心圆);右图的纵坐标是表示模长,图上只给出了辐角的等值线.

  • 实部-虚部图:把一个复变函数看作两个函数:\(u(z),v(z)\),分别作为实部和虚部: \[ f(z)=u(z)+\i v(z) \] 又因为\(z=x+\i y\),从而\(u,v\)就是二元的实变量函数: \[ f(x,y)=u(x,y)+\i v(x,y) \] 所以可以把\(u,v\)的图像曲面分别在两个三维坐标系中画出.

  • 动画:把复平面上每个点\(z_0\)"移动"到对应的\(f(z_0)\),这在之后会展示.

2 加法与乘法

2.1 加法与平移

每个复数都可以看做复平面中的一个点,或者是一个向量(这里我们用列向量), \[ z=a+b\i(a,b\in\R) \leftrightarrow \text{点}(a,b) \leftrightarrow \text{向量}\pmqty{a\\b} \] > 在下文中的某些地方,"点"、"复数"、"向量"可能不加区分地使用.

其中向量空间的基是\(\qty{1,\i}\)​. 我们可以直接将向量的加法和数量乘法类比过来, \[ \Align{ &\pmqty{a\\b}+\pmqty{c\\d}=\pmqty{a+b\\c+d} \rightarrow (a+b\i)+(c+d\i)=(a+b)+(c+d)\i \\ &\lambda\pmqty{a\\b}=\pmqty{\lambda a\\\lambda b} \rightarrow \lambda(a+b\i)=(\lambda a)+(\lambda b)\i \\ } \]

其中\(a,b,c,d,\lambda\in\R\)​. 这样定义是和实数的加法和乘法兼容的,因为实数加法和乘法可以看作一维向量的线性运算.

如果我们把加法看作一个变换,把\(z+w\)​看作把"加\(w\)​"作用在复数\(z\)​​​上面,\(f(z)=z+w\)​. 设\(z=a+b\i,w=c+d\i\)​,\(f(z)\)看作向量函数 \[ f(\pmqty{a\\b}) = \pmqty{a\\b}+\pmqty{c\\d} = \pmqty{a+c\\b+d} \] 如果我们把\(f\)​作用于复平面上每个复数,那么效果就是所有点都按照向量\(\pmqty{c\\d}\)平移​​​.

平移变换和复数加法​​是一一对应的.

2.2 乘法与旋转

对于复数乘法,我们按照多项式乘法原则定义 \[ (a+b\i)\cdot(c+d\i)=ac+ad\i+bc\i+bd\i^2=(ac-bd)+(ad+bc)\i \] 显然,复数乘法是满足交换律(可交换)的,而且对于加法满足分配律,且对之前定义的标量乘法兼容(即\(d=0\)​​​的情况.)

下面需要一定线性代数基础,可以直接跳过看\(\S3.1\).

重新来看复数乘法的式子,用向量\(\pmqty{a\\b},\pmqty{c\\d}\)表示复数\(a+b\i,c+d\i\),两者相乘,得到了\(\pmqty{ac-bd\\bc+ad}\),可以看出是一个矩阵和向量相乘的结果: \[ \pmqty{ac-bd\\bc+ad}=\pmqty{a&-b\\b&a}\pmqty{c\\d} \] 所以说,复数乘法(一个数乘以\(z=a+b\i\))实际上和矩阵\(\vb{Z}=\pmqty{a&-b\\b&a}\)表示的变换是等价的. 对矩阵进行变形: \[ \vb{Z}=|z|\pmqty{ \frac{a}{\sqrt{a^2+b^2}} & \frac{-b}{\sqrt{a^2+b^2}} \\ \frac{b}{\sqrt{a^2+b^2}} & \frac{a}{\sqrt{a^2+b^2}} } \]\(\cos\theta=\dfrac{a}{\sqrt{a^2+b^2}}\in[-1,1]\)​​,\(\sin\theta=\dfrac{b}{\sqrt{a^2+b^2}}\in[-1,1]\)​​,其中\(\theta\in[0,2\pi)\)​​,那么 \[ \vb{Z} =|z|\pmqty{\cos\theta&-\sin\theta\\\sin\theta&\cos\theta} =\pmqty{|z|&0\\0&|z|}\pmqty{\cos\theta&-\sin\theta\\\sin\theta&\cos\theta} \] 显然是一个旋转矩阵和一个缩放矩阵的乘积,它表示的变换就是旋转和缩放的复合. 注意到

所以\(\theta\)实际上是\(z\)的辐角(主值).

所以一个数乘以一个复数\(z\),就是把它表示的点(或向量)绕原点旋转\(\theta\)(逆时针为正),并且放大\(|w|\)倍. 若复数是单位复数(模长为一),那么保留下来的就只有旋转. 单位复数和二维旋转变换是一一对应的. 采用极坐标表示复数的话,这一点会更加清晰.

每个复数都与一个"缩放旋转"矩阵对应,若\(|z|=1\),则它的矩阵只表示旋转.

\(1\)对应单位阵\(\pmqty{1&0\\0&1}\);虚数单位\(\i\)对应\(\pmqty{0&-1\\1&0}\),是旋转\(90^\circ\)矩阵.

3 极坐标形式

3.1 乘法与除法

给定一个辐角\(\theta\)和模\(r\ge0\)​​可以唯一确定一个复数, \[ z=r(\cos\theta+\i\sin\theta)=r\ang\theta \rightarrow \text{极坐标形式}(r,\theta) \] 再来考虑复数乘法,设\(z=|z|(\cos\theta+\i\sin\theta)\)\(w=|w|(\cos\phi+\i\sin\phi)\),则 \[ \Align{ z\cdot w &= |z|(\cos\theta+\i\sin\theta) \cdot |w|(\cos\phi+\i\sin\phi) \\ &= |z|\cdot|w|\cdot\bqty{ \cos\theta\cos\phi-\sin\theta\sin\phi +\i(\cos\theta\sin\phi+\sin\theta\cos\phi) } \\ &= |z||w|(\cos(\theta+\phi)+\i\sin(\theta+\phi)) } \] 它们的乘积\(z\cdot w\)模是两者模的乘积,辐角是两者辐角之和,这与\(\S2.2\)​我们得出的结论是一致的.

考虑变换\(f(z)=z\cdot w\)​,它把复平面上所有的点先旋转\(\arg(w)\)​,再拉伸\(|w|\)​倍. 如果\(w\ne0\),变换前后的图形必定是相似的.

下面的动画演示了\(f(z)=z\cdot(2+\i)\).

再看平方对复平面的作用,\(f(z)=z^2\):(为了清晰,这里仅展示了上半平面,还有一个扇形网格)

变换后的坐标系格线都是抛物线. \[ z=a+b\i \to (a+b\i)^2=(a^2-b^2)+2ab\i \to \text{点}(a^2-b^2,2ab) \]

关于除法,刚好和乘法反过来. 除以一个数就是乘它的倒数. 定义一个非零复数的倒数\(z^{-1}\)\[ z\cdot z^{-1} = 1 \] 因为\(1\)的辐角主值为\(0\),模为\(1\),所以\(z^{-1}\)的辐角主值为\(-\arg z\),模为\(\dfrac1{|z|}\);所以,除以\(z\),即乘以\(z^{-1}\),辐角加了\(-\arg{z}\),也就是辐角相减;模乘以\(\dfrac1{|z|}\),也就是模相除.

此外,也可以等价地按照多项式除法定义:\((a+b\i)/(c+d\i)\).

下面展示了\(f(z)=\dfrac1z\)对复平面的作用(最后放大了方便看),变换后的格线很像圆.

\(z=a+b\i(a,b\in\R)\)\[ z^{-1}=\frac{a-b\i}{a^2+b^2}=\frac{a}{a^2+b^2}+\frac{-b}{a^2+b^2}\i \to \text{点}\pqty{\frac{a}{a^2+b^2}, \frac{-b}{a^2+b^2}} \] 点的轨迹方程\(\Cases{x=\frac{a}{a^2+b^2}\\y=\frac{-b}{a^2+b^2}}\)

  • 消去\(a\)得到\(x^2+\pqty{y+\dfrac1{2b}}^2=\pqty{\dfrac1{2b}}^2\),即当\(b\)为定值(即原来黄色的横向格线),变换后的图形是圆心在纵轴,且与横轴相切的圆.

  • 消去\(b\)得到\(\pqty{x-\dfrac1{2a}}^2+y^2=\pqty{\dfrac1{2a}}^2\),即当\(a\)为定值(即原来蓝色的纵向格线),变换后的图形是圆心在横轴,且与纵轴相切的圆.

复数乘法的几何意义使得它有很多几何上的应用,例如:

例子:平面四边形\(abcd\),在每条边外作正方形,求证:相对的正方形中心连线\(pq,st\)垂直且相等.

可以尝试使用复数乘法解决这个问题,也可以想想用纯几何方法怎么做.

3.2 de Moivre公式

棣莫弗公式(de Moivre's formula)是上面乘法结论的推广,对\(\theta\in\R\)​​和\(n\in\Z\)​​, \[ (\cos\theta+\i\sin\theta)^n=\cos{n\theta}+\i\sin{n\theta} \] 其中\(\cos\theta+\i\sin\theta\)是辐角为\(\theta\),模为\(1\)的复数,它的\(n\)次方的模仍然为\(1\),辐角为\(n\theta\).

我们可以看看高次方程\(x^n=1(n\in\N_+)\)的解,利用乘法的几何意义,一个复数的\(n\)次方是\(1\),首先它的模长是\(1\),其次它的辐角是\(1\)的辐角(\(\Arg1=2k\pi\))的\(\dfrac1n\),所以它的根 \[ x = \cos\dfrac{2k\pi}n+\i\sin\dfrac{2k\pi}n, k\in\Z \]\(k\)​取遍整数,\(\dfrac{2k\pi}n\)​只表示\(n\)​​个不同的辐角(终边相同的认为是同一个角),所以根一共有\(n\)​个,称为\(n\)​次单位根,一般记作\(\omega\)​. 如下图是5次单位根.

从上面的推导可以看出来,\(1^{1/5}\)\(5\)个不同的值的原因是因为\(\Arg\)函数是多值的.

4 指数与对数

在下面的几节,我们尝试将实数域中的基本初等函数扩充到复数域. 一个基本原则是

  1. \(z\)取实数,函数值与实变量的函数值相等.
  2. 保持函数的基本特征.

4.1 指数函数&Euler公式

指数函数(Exponential function)​的定义可以参考实指数函数:

指数函数可以由幂级数\(\sum\limits_{k=0}^\infty\dfrac{x^k}{k!}=1+\dfrac{x^1}{1!}+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+\dots\)定义(收敛半径为\(+\infty\),可推广到任意\(z\in\C\)).

定义指数函数函数\(\exp: \C\to\C\)\[ \e^z = \exp{z} := \sum_{k=0}^\infty \dfrac{z^k}{k!} \] (规定\(z^0=1\);与实指数函数不同,这里的\(\e^z\)不表示无理数\(2.718\dots\)\(z\)次幂,而是一个记法)

随便选定一个复数\(z\),把\(1,\dfrac{z^1}{1!},\dfrac{z^2}{2!},\dfrac{z^3}{3!},\dots\)首尾相接地画出来,会形成一个线段组成的螺旋:

每两条线段之间的夹角是定值,等于\(z\)的辐角.

指数函数是单值的,而且满足\((\exp z)'=\exp z\),是指数函数的一个非常重要的特征.

欧拉公式(Euler's formula)在复分析领域是一个非常基本、有用的公式,它把三角函数和指数函数联系了起来. 对\(\theta\in\R\)​​, \[ \large{ \e^{\i\theta} = \cos\theta+\i\sin\theta } \]

\(\theta=\pi\)代入,可以得到著名的Euler恒等式:\(\e^{\i\pi}+1=0\).

通过这个公式,每一个模长为\(1\)的复数\(z\)都可以写成指数形式,\(z=\e^{\i\Arg z}\). 如果我们在这前面乘上一个系数\(|z|>0\)作为\(z\)模长,那么复平面上每个非零复数都可以用指数表示(若\(z=0\)\(|z|=0\),那么无论\(\Arg{z}\)取何值,下式都为零):, \[ z = |z|\cdot\e^{\i\Arg z} \]

证明:从质点运动的角度,

\(w=\cos t+\i\sin t\)​,当\(t\)​改变时,\(w\)​在单位圆上逆时针运动. 在每单位时间内,\(w\)​走了\(1\)​弧度,所以运动的角速度大小为\(1\)​,从而速度大小为\(1\)​​.

又因为速度\(v\)方向沿单位圆切线,与位矢方向呈\(90^\circ\)夹角,也就是位矢\(w\)乘以\(\i\),所以 \[ v=\dv{w}{t}=\i w \] 因为指数函数的导数等于它自身\((\e^z)'=\e^z\),所以解得\(w=C\e^{\i t}\),再代入\(w(0)=1\),得到\(w=\e^{\i t}\),从而\(\cos t+\i\sin t=w=e^{\i t}\)​.​

考虑一个函数 \[ z(t) = A\e^{\i(\omega t+\varphi)} \] 其中\(A\ge0\)​​,\(\omega,\varphi\in\R\)​​​​. 它描述了一个复平面上的匀速圆周运动,圆心在原点,\(A\)是半径,\(\omega\)是角速度,\(\varphi\)是初始角度. 这个圆周运动在实轴和虚轴上的投影分别是两个简谐运动: \[ \Align{ \Re{z(t)} &= A\cos(\omega t+\varphi) \\ \Im{z(t)} &= A\sin(\omega t+\varphi) } \]

所以说,简谐运动是匀速圆周运动的投影,Euler公式给我们带来了一种非常简便的描述这些运动的方式.

下面来看指数函数的一些性质.

可以证明,实数域上指数的运算法则仍然成立(加法法则):\(\exp(z+w)=\exp(z)\exp(w)\).

从而可以得指数函数是周期函数: \[ \e^{z+2k\pi\i}=\e^z\e^{2k\pi\i}=\e^z(\cos(2k\pi)+\i\sin(2k\pi))=\e^z ,\quad k\in\Z \] 一个周期是\(2\pi\i\). 这就说明,指数函数不再是一一对应函数了,出现了多对一的情况,从后面的动画中也可以看出来,平面某些部分被折叠到了一起,重合了.

\(\exp(a+b\i)=\e^a\e^{\i b}\)可以得出指数函数的值域是\(\C\setminus\set0\),因为\(\e^a>0\)\(\e^{\i b}\)可以表示任意方向上的单位复数,两者乘积便可以表示除了原点外复平面上所有的复数.

指数函数对复平面上点的变换:

实部\(\Re\)的等值线(蓝色)好像变成了以原点为圆心的圆.(虚轴形成了黑色的单位圆.)

虚部\(\Im\)的等值线(黄色)似乎变成了以原点为端点的射线.

比较容易解释:设\(z=a+b\i(a,b\in\R)\),则 \[ w=\exp(a+b\i)=\exp(a)\exp(b\i)=\exp(a)\pqty{\cos{b}+\i\sin{b}} \]\(a\)是定值,则所有\(w\)构成一个半径为\(\exp(a)\)的圆;若\(b\)是定值,则所有\(w\)构成一条角度是\(b\)的去端射线.

之前说过可以用模长-辐角图是可视化复变函数的一种方法,\(w=\exp(z)\)

图中白色平面(\(\Im(z)=0\))和图像的交线就是实变函数\(y=\e^x\)的图线.

4.2 对数函数

对数函数(Logarithm function)是指数函数的反函数,由于指数函数不是一一映射,所以对数函数是多值函数.

若想求出它的公式,从Euler公式开始, \[ z=|z|\cdot\exp(\i\Arg z)=\exp(\ln|z|+\i\Arg z),\quad z\ne0 \] 所以我们定义复变对数函数(大写的) \[ {\rm Ln}\, z=\ln|z|+\i\Arg z, \quad z\ne0 \] 对数函数的多值性来源于指数函数的周期性,而这在公式中体现为多值的\(\Arg\). \({\rm Ln}\)的值域是\(\exp\)的定义域,即\(\C\).

如果我们把辐角变成辐角主值,那就得到了单值的对数函数(小写的), \[ \ln z=\ln|z|+\i\arg z, \quad z\ne0 \] \(\ln:\C\setminus\set0\to\C\),值域是\(\qty{z|\Im z\in(-\pi,\pi]}\).

单值复变对数函数的零点仍然只有一个\(z=1\)\[ \ln{z}=0 \iff \ln|z|+\i\arg{z}=0 \iff \Cases{|z|=1\\\arg z=0} \iff z=1 \] 一些运算性质:

  • \(\exp(\ln z)=z\)\(z\ne0\)).

  • 幂的积:\(\exp(z+w)=\exp(z)\exp(w)\).

  • 幂的乘方:\(\exp(z)^w=\exp(zw)\).

  • 注意,\(\ln(zw)=\ln(z)+\ln(w)\)不一定成立,因为\(\arg\)运算值域的限制.

    \(\arg z+\arg w\)只有在\((-\pi,\pi]\)内时才等于\(\arg(zw)\)相等.)

    但是如果是\({\rm Ln}\)的话,就有\({\rm Ln}\,(zw)={\rm Ln}\, z+{\rm Ln}\, w\),这里的等号应该理解为取值集合相等.

函数在原点没有定义,原点附近的值会被拉到左边很远的地方,所以都去掉了.

每格的边长为\(1/2\).

可以注意到函数把复平面压缩在了虚部为\((-\pi,\pi]\)的部分.

如果把两个函数复合起来,对数在内\(g(z)=\exp(\ln z)=z\)\(z\ne0\)),

指数在内,\(h(z)=\ln(\exp z)\)

平面最后没有被复原,而是折叠到了\(\qty{z|\Im{z}\in(-\pi,\pi]}\)的区域.

此外,三角函数、双曲函数这两种基本初等函数和它们的反函数也可推广到复数域,在这里不说了.

4.3 幂函数

这一部分偏重代数运算,如果不想看可以跳过.

实际上在之前de Moivre公式一节里面,我们已经发现,对于\(w=z^n\),如果\(n\)是整数,那么一个\(z\)恰好对应一个\(w\)(对\(n<0\)要求\(z\ne0\)),即此时\(w\)是单值的函数. 而类似\(w=z^{1/5}\)的则是多值的. 为了更好研究这一点,我们先严谨的给出幂函数的定义.

对于实数\(x\),那么有一种表示指数的方法\(x^3=\e^{3\ln{x}}\),现在看看能不能同样用指数和对数定义复变指数函数, \[ w=z^\alpha=\exp(\alpha\cdot{\rm Ln}\,{z}), \quad z\ne0 \] 把它展开(在每一步中都把多值的部分标了出来) \[ \Align{ w &=\exp(\alpha\cdot\orange{{\rm Ln}\,{z}}) \\ &=\exp[\alpha( \ln|z|+\i\orange{\Arg z} )] \\ &=\exp(\alpha\ln|z|)\cdot \exp(\alpha\i\orange{\Arg z}) \\ &=\exp(\alpha\ln|z|)\cdot \exp[\alpha\i(\arg z+2\orange{k}\pi)] & (\orange{k\in\Z}) \\ &=\exp(\alpha\ln|z|) \cdot \exp(\alpha\i\arg{z}) \cdot \exp(\alpha\cdot2\orange{k}\pi\i) } \] - 可见,问题出在了\(\exp(\alpha\cdot2\orange{k}\pi\i)\)上,随着\(\orange{k}\)的改变,这个因式会取不同的值.

  • 如果\(\alpha\)是整数,那么\(\alpha\cdot2\orange{k}\pi\i\)就是指数函数的一个周期,所以无论\(\orange{k}\)怎么变化,自变量总是会相差周期的整数倍,\(\exp(...)\)都是单值的,从而幂函数\(w=z^\alpha\)也是单值的.

  • 如果\(\alpha\)是有理数,可以表示成既约分数\(\dfrac{p}{q}\)\(p,q\in\Z\)),设\(\orange{s}=\dfrac{p}{q}\cdot2\orange{k}\pi\i\)

    • \(\orange{k}=1,2,\dots,(q-1),q\)的时候,一个\(\orange{k}\)对应了一个不同的\(\orange{s}\)的值.

    • \(\orange{k}\)取其他的整数,\(\orange{s}\)便开始重复,因为 \[ \orange{s} = \frac{p}{q}\cdot2(\orange{k}+nq)\pi\i = \frac{p}{q}\cdot2\orange{k}\pi\i+2np\pi\i \qquad(n\in\Z) \] 加上了一个\(2np\pi\i\),而\(2np\pi\i\)是指数函数的周期,所以\(\orange{s}\)的值开始重复了.

    所以此时\(\exp(2\orange{k}\pi\i\cdot\alpha)\)只有\(q\)个不同的取值,所以\(w=z^\alpha\)\(q\)值的.

  • 如果\(\alpha\)的值是无理数,甚至虚数,那么\(\exp(2\orange{k}\pi\i\cdot\alpha)\)就不会重复了,它有无穷多个不同的值,幂函数是无穷多值的.

例如,\(\i^\i\)是多少? \[ \Align{ \i^\i &=\exp(\i{\rm Ln}\,\i) =\exp[\i(\ln1+\i\Arg\i)] \\ &=\exp\pqty{-\Arg{\i}}=\exp(-\frac\pi2+2k\pi) &(k\in\Z) } \]

有无穷多个值,但它们都是实数!

有一个很经典的错误案例:\(-1=\sqrt{-1}^2=\sqrt{-1}\cdot\sqrt{-1}\;{\color{red}=}\;\sqrt{(-1)\cdot(-1)}=\sqrt{1}=1\),错就错在了红色等号处,因为对于\(x_1,x_2<0\),不满足\(\sqrt{x_1}\sqrt{x_2}=\sqrt{x_1x_2}\).

为什么?原因就在上面. 上面的开算术平方根实际上对应了幂函数\(z^{1/2}\)(是2值的),而算术平方根只取了其中一个,在非负实数范围内,这看不出来影响,但若拓展到实数甚至复数域,就会有问题了.

引入复变幂函数后,有 \[ z_1^{1/2} \cdot z_2^{1/2} = (z_1z_2)^{1/2} \] 等号左边是多值的,等号右边也是多值的,等号要这样理解:

举例:设\(z_1=z_2=-1\)\(z_1^{1/2}=\pm\i\)\(z_2^{1/2}=\pm\i\)\((z_1z_2)^{1/2}=\pm1\),我们对\(z_1,z_2\)\(1/2\)次方的取值分类讨论:

  • \(z_1^{1/2}\)\(+\i\)
    • \(z_2^{1/2}\)\(+\i\):则左边\(=-1\),对应了右边\((z_1z_2)^{-1}\)\(-1\).
    • \(z_2^{1/2}\)\(-\i\):则左边\(=+1\),对应了右边\((z_1z_2)^{-1}\)\(+1\).
  • \(z_1^{1/2}\)\(-\i\)
    • \(z_2^{1/2}\)\(+\i\):则左边\(=+1\),对应了右边\((z_1z_2)^{-1}\)\(+1\).
    • \(z_2^{1/2}\)\(-\i\):则左边\(=-1\),对应了右边\((z_1z_2)^{-1}\)\(-1\).

而最初展示的错误案例让\(z_1,z_2\)\(1/2\)次方都取了\(\i\),而乘积的\(1/2\)次方却取了\(+1\),显然有问题,归根结底就在算术平方根的"选择性取值"上.

到这里,我们发现:如果我们把\(z=\e=2.718\dots\)代入\(w=z^\alpha\),即\(w=\e^z\),和我们之前定义的指数函数长得很像,但是这里的\(\e^z\)显然是多值的,但是之前定义的指数函数是单值的啊?为了避免这种困惑,我们在之前就做出了规定,指数函数\(\e^z\)不是常规意义上的\((2.718\dots)^z\),而是一种记号. 为了避免混淆,我们还发明了指数函数专门的记号\(\exp(z)\).

5 变换的几何性质

前面几节的动图展示的变换有一些共有的几何性质,这一节我们主要研究这些性质.

宏观上看,这些变换好像没什么共同点,既没有把几何图形伸缩固定的倍数或者旋转一定的角度,也没有保持直线的平行等关系(甚至有的直线变成了曲线、曲线变成了直线).

这时候我们可以从更"细致"的角度,即微观的角度:

观察格线的交点,则可以发现:原来垂直的格线(黄色和蓝色的),在变换之后仍然垂直(交点处的切线垂直,这是微观的角度). 既然如此,我们就需要研究复变函数变换的微观特性,即研究微积分理论.

\(\S5.1\)给出了一些概念的严格定义,不想看的话可以先看\(\S5.2\):先有一个直观上的认识;况且复变函数的微分理论和实变函数有很多相似点,可以大致当成实变函数来理解.

5.1 函数的可导

在数轴上,我们有邻域、开区间、闭区间的定义,现在我们把它们拓展到复平面上. 这些定义看起来比较吓人,但是它们都有很直观的几何解释.

邻域(Neighborhood):\(z_0\)的邻域:\(U(z_0,\delta)=\qty{z\big||z-z_0|<\delta}\),是一个不含边界的圆盘.

\(S\subset\R^2\)是一些点的集合,对于里面的点\(z\)

  • \(z\)的某个邻域完全落在\(S\)内,则称\(z\)内点.
  • \(z\)的某个邻域完全落在\(S\)外,则称\(z\)外点.
  • \(z\)的所有邻域既有\(S\)中的点,也有不在\(S\)中的点,那么称\(z\)边界点.

连通集:如果点集\(S\)中任意两点\(x,y\)都可以用一条全部包含于\(S\)的折线连起来,那么\(S\)是连通集.

如果点集\(S\)中所有的点都是内点(即没有边界点),那么\(S\)开集;开集的补集是闭集.

连通的开集称为区域,区域\(D\)和它的所有边界点构成了一个闭区域.

复变函数的导数与微分可以在形式上完全仿照一元实变函数:

函数\(w=f(z)\)定义在区域\(D\)上,如果在\(z_0\)处,自变量增量与因变量增量的极限 \[ \lim_{\Delta z\to0}\frac{\Delta w}{\Delta z} =\lim_{\Delta z\to0}\frac{f(z_0+\Delta z)-f(z_0)}{\Delta z}, \quad (z_0,z_0+\Delta z\in D) \] 存在,则称\(f(z)\)\(z_0\)处可导,极限值为\(z_0\)处的导数,记为\(f'(z_0)\)\(\dv{w}{z}(z_0)\).

此时,在\(z_0\)处,因变量的改变量\(\Delta w\)也可以写作自变量的改变量\(\Delta z\)乘以导数,再加上\(|\Delta z|\)的高阶无穷小, \[ \Delta w=f'(z_0)\Delta z+ o(|\Delta z|) \] 如果自变量该变量的模\(|\Delta z|\)充分小(\(\to0\)),直接略去高阶无穷小,得到 \[ \dd{w}=f'(z_0)\dd{z} \] 其中\(\dd w\)称为因变量在\(z_0\)的的微分,\(\dd z\)称为自变量在\(z_0\)的微分.

例如,函数\(w=z^2\)\(z_0\in\C\)处的导数: \[ \lim_{\Delta z\to0}\frac{\Delta w}{\Delta z} =\lim_{\Delta z\to0}\frac{(z_0+\Delta z)^2-z_0^2}{\Delta z} =\lim_{\Delta z\to0}\frac{2z_0\Delta z+\Delta z^2}{\Delta z} =\lim_{\Delta z\to0}(2z_0+\Delta z)=2z_0 \]

如果\(f(z)\)\(z_0\)的某个邻域中每个点都可导,那么称\(f(z)\)\(z_0\)解析,如果\(f(z)\)\(D\)中的每个点都解析,那么称\(f(z)\)\(D\)上解析,称\(f(z)\)解析函数(Analytic function). 解析函数具有一些很好的性质,是复分析的主要研究对象.

函数在区域(区域是开集)内处处可导\(\iff\)函数在区域内解析.

5.2 导数的几何意义

要解决夹角问题,我们只需要研究在一个很小的局部内,变换的效果是什么.

设在复平面上的区域\(D\)内解析(即\(D\)内处处可导)的函数\(w=f(z)\)\(z_0\in D\).

考虑\(z_0\)附近的(邻域内的)一个数\(z_1=z_0+\Delta z\),以点\(z_0\)\(z_1\)为端点有一条很短的线段,线段的方向就是向量\(\Delta z\)的方向,长度是向量\(\Delta z\)的模长.

应用\(w=f(z)\)变换后,\(w_0=f(z_0)\)\(w_1=f(w_1)\)\[ \Delta w=w_1-w_0=f(z_0+\Delta z)-f(z_0) \] (因为\(f(z)\)解析)当\(\Delta z\)的模足够小,因变量改变量可以近似为 \[ \Delta w = f'(z_0)\Delta z \] 此时\(\Delta w\)的模长和方向分别表示变换后线段的长度和方向.

根据复数乘法的几何意义, \[ \Align{ \Arg(\Delta w) &= \Arg(f'(z_0))+\Arg(\Delta z) \\ |\Delta w| &= |f'(z_0)|\cdot|\Delta z| } \] 所以线段的长度乘以了导数的模,并且按照导数的辐角旋转了一个角度.

从而可以说:在\(z_0\in D\)的一个很小的邻域内,解析函数\(w=f(z)\)表示的变换的作用效果是缩放和旋转的复合. 如果\(|f'(z_0)|=0\),函数把这一区域压缩成了一个点;如果\(|f'(z_0)|\ne0\),那么这一区域内变换前后的图形是相似的.

实变函数可以看作对数轴的变换,导数的大小表示的是某一点附近被拉伸的程度.

下面的动画展示了\(f(z)=\dfrac12z^2\)在点\(1+\sqrt3\i\)的附近对图形的变换. 左下角展示了局部放大的画面. 为了方便对比,放了一个字在\(1+\sqrt3\i\)上面.

我们把这种在局部具有如此性质的映射给出一个正式的描述:

共形映射(Conformal mapping),也称保形变换. 若区域\(D\)上的\(w=f(z)\)满足:

  • 是一一映射.(变换前后的点一一对应)
  • 具有保角性.(\(D\)内任意两条相交曲线夹角的大小、方向不变,即任意一点附近被旋转.)
  • 具有保伸缩率性.(\(D\)内任意一点附近被"各个方向上均匀缩放".)

则称\(w=f(z)\)是区域\(D\)内的共形映射.

"共形"可以理解为在邻域内的图形变换前后形状相同,即相似.

函数解析且导数不为零能保证它满足后两个条件,再加上一个一一映射便能保证它是一个共形映射: \[ \boxed{\text{解析}} + \boxed{f'(z)\ne0} + \boxed{\text{一一映射}} = \text{共形映射} \]

\(w=\exp(z)\)不是共形的,因为\(\exp(z+2\pi\i)=\exp(z)\),不是一一射. 如果限制其定义域为\(\qty{z|\Im z\in(-\pi,\pi)}\),那么它就是一个一一映射,而且\((\exp z')=\exp z\ne0\),从而是一个共形映射.

下面我们来讨论一种特殊的共形映射——分式线性映射.

5.3 分式线性映射

\[ w=\frac{az+b}{cz+d}, \quad (ad-bc\ne0) \] 这种映射被称为分式线性映射(Linear fractional mapping),其中\(a,b,c,d\)都可以在复数域内取值.

\(ad-bc\ne0\)是为了使它有逆映射,即\(z=\dfrac{dw-b}{-cw+a}\).

分式线性映射可以分解成更基本映射的复合:

例:\(w=\dfrac{2z}{z+\i}\). \[ \Align{ w =\frac{2z}{z+\i} =\frac{2(z+\i)-2\i}{z+\i} =2+\frac{-2\i}{z+\i} =2+2\e^{-\pi\i/2} \frac{1}{z+\i} } \] (最后一步用了Euler公式)可以看出其复合过程为 \[ z \xrightarrow[\text{平移}]{z+\i} z_1 \xrightarrow[\text{倒数}]{1/z_1} z_2 \xrightarrow[\text{旋转}]{\exp(-\pi\i/2)z_2} z_3 \xrightarrow[\text{缩放}]{2z_3} z_4 \xrightarrow[\text{平移}]{z_4+2} w \] 动画(去掉了使分母为零的点\(-\i\)):

一个一般的分式线性映射可以由以下四种最简单的分式线性映射复合而成:

  1. 平移\(w=z+b\)\(b\in\C\)).
  2. 旋转\(w=\e^{\i\theta}z\)\(\theta\in\R\)).
  3. 缩放\(w=rz\)\(r>0\)).
  4. 倒数\(w=\dfrac1z\).

我们来看看第四种,它也称为反演映射(Inversion mapping),就是\(\S3.1\)动画中的\(f(z)=\dfrac1z\). 继续对其进行分解: \[ w=\dfrac1z =\dfrac1{a+b\i} =\dfrac{a-b\i}{a^2+b^2} =\frac{1}{|z|^2} \overline{z} \] 可以看出是先缩放\(\dfrac1{|z|^2}\)倍,再取共轭(关于实轴对称). 经过第一步缩放后,单位圆外的点到了单位圆内;单位圆内的点到了单位圆外,圆上的点不变,所以这个缩放也可以看作"关于圆的对称".

反演映射在原点没有定义,但是若我们扩充复数集:

\(1/0=\infty\)为无穷大,\(\hat\C=\C\cup\qty{\infty}\)称为扩充的复数集.

无大对应扩充复平面上的无穷远点(Point at infinity),是一个假想的点. 任何直线都通过无穷远点.

作一个与复平面相切于原点的球面,切点为原点\(S\)(南极),过原点作垂直于复平面的直线,交球面于另一点\(N\)(北极). 取球面上除\(N\)外任意一点\(P\),射线\(NP\)交复平面(除无穷远点)于唯一一点\(Q\),这两个点是一一对应的. 如果\(P=N\),即\(NP\)是球面在\(N\)的切线,那么\(NP\)与复平面的交点\(Q\)是无穷远点.

这个模型是黎曼球面(Riemann sphere)模型.

运算:对\(z\in\C\)\(z/0=\infty(z\ne0)\)\(z/\infty=0\)\(z+\infty=\infty\)\(z\cdot\infty=\infty(z\ne0)\).

对于\(w=1/z\),有\(1/0=\infty\)\(1/\infty=0\),所以\(w=1/z\)成功地成为了扩充复数集上的双射. 其他3种简单分式线性映射也可以推广到扩充复数集,而且是一一映射. 进而可以证明,分式线性映射是解析的,所以分式线性映射是共形映射.

分式线性映射作为一种特殊的共形映射,有它自己的特殊的性质.

保圆性:在扩充复平面上,分式线性映射把圆映成圆.

这里的圆是扩充复平面中的,除了一般的欧式空间中的圆之外,直线也算作圆,半径是无穷大.

性质的证明:第1-3种简单分式线性变换显然保圆,只需证明反演变换的保圆形即可. 把变换前的点坐标用变换后的坐标表示,代入圆的方程即可证得.

显然,如果一个圆不经过\(z_0\)\(z_0\)代入变换后分母为零),那么它会被映成一个半径有限大的圆;反之则会被映成半径无穷大的圆(直线).

下面的动画展示了反演变换的保圆性.


复数值得研究的东西有很多,这里只展示了冰山一角.

复数的引入不仅完善了数学体系(复数域对加减乘除、指对幂、极限都是封闭的),同时还能解释一些以前解释不通的东西:

  • 例如错误案例\(-1=\sqrt{-1}^2=\sqrt{-1}\sqrt{-1}\;{\color{red}=}\;\sqrt{(-1)(-1)}=\sqrt{1}=1\).

  • 再如之后可能会写到的Taylor级数收敛半径问题.

找到一些数学对象的内在联系:

  • 三角函数和指数函数的联系:\(\exp(\i x)=\cos{x}+\i\sin{x}\).

  • 三角函数和双曲函数的联系:\(\i\sin{z}=\sinh(\i z)\)\(\cos{z}=\cosh(\i z)\).

还为描述某些现象提供了全新的视角:

  • 复数的乘法和乘方来描述二维中的旋转,进而还有Fourier变换(从热流到画圈圈Fourier变换可视化),这是计算机信号处理和文件格式JPEG、MP3的基石!
  • 解析函数的实部和虚部可以表示某种流体的流和势.

……


复数与变换
https://disembo.github.io/Visualizing/complex-and-transforms/
作者
jin
发布于
2021年9月4日
许可协议