跳转到内容

从三次方程到复指数

学生第一次见到复数,常问的不是一道题怎么做。

他们卡住的是:ii 到底算不算数?如果 i2=1i^2=-1 只是老师规定出来的,那我是不是也可以规定一个新符号,让它满足任何我想要的性质?

再往后,eiθe^{i\theta} 更像离谱升级版。指数上放一个无理数已经够抽象了,现在还要把 ii 放上去,然后告诉学生它等于 cosθ+isinθ\cos\theta+i\sin\theta。学生不一定反驳,但心里很可能把它放进“高级公式,先背下来”那一类。

我不太愿意把这件事简单归结成学生不接受新东西。很多时候,是中间那段数学被我们压缩掉了。

先别从“规定 i2=1i^2=-1”开始

Section titled “先别从“规定 i2=−1i^2=-1i2=−1”开始”

“规定 i2=1i^2=-1”这句话没有错。问题是,如果它是入口,学生看到的是一个人为添加的对象。老师知道后面有代数、几何、微分方程的支持,所以觉得这条规定顺理成章;学生此刻只看到一个孤零零的符号。

我更愿意先摆一个尴尬的事实:有些实数问题,明明答案是实数,中间却逼你面对负数开平方。

最常用的课堂版本是三次方程

x315x4=0.x^3-15x-4=0.

这个方程有一个很朴素的实数解:x=4x=4。代进去就是

64604=0.64-60-4=0.

问题来了。如果用卡尔达诺公式处理这类三次方程,中间会出现

121.\sqrt{-121}.

也就是说,公式似乎要求我们计算

2+1213+21213.\sqrt[3]{2+\sqrt{-121}}+\sqrt[3]{2-\sqrt{-121}}.

这里不用完整推卡尔达诺公式。只要让学生看到一件事:一个明明有实数解的方程,按当时的公式算下去,会把 121\sqrt{-121} 摆到你面前。它不是为了制造神秘感才出现的。

Bombelli 这段历史,课堂上要说得保守一点:16 世纪的代数学家在三次方程里遇到这种“看起来不合法”的中间量;Bombelli 认真计算这些量的运算规则,并展示它们可以在最后合成实数答案。比如在上面的例子里,可以观察到

(2+i)3=2+11i,(2i)3=211i.(2+i)^3=2+11i,\qquad (2-i)^3=2-11i.

所以

2+11i3+211i3=(2+i)+(2i)=4.\sqrt[3]{2+11i}+\sqrt[3]{2-11i}=(2+i)+(2-i)=4.

我们今天写得很顺,是因为已经有现代复数符号。历史上并不是大家一开始就这么清楚。更准确地说,不是先有人拍脑袋规定了一个新数,再强迫方程配合它;是实数方程的计算先把这种中间对象推到了台前。

“虚”这个名字很容易误导学生。它听起来像假货,其实更像一套原本没有画出来的坐标。它一开始怪,是因为我们只允许自己站在实数轴上看问题。

承认 ii 之后,学生还会问第二个问题:就算 ii 可以算,为什么 eiθe^{i\theta} 会和三角函数扯上关系?

如果这时直接给欧拉公式

eiθ=cosθ+isinθ,e^{i\theta}=\cos\theta+i\sin\theta,

多数学生会觉得它很漂亮,也很不可解释。问题也在这里:漂亮公式特别容易被学生当成神秘结论背下来。

我更愿意从微分方程进来。

我们先把指数函数从“重复乘法”里拿出来。对 A-Level Further Maths 的学生来说,erxe^{rx} 最重要的性质不在图像,而在求导:

ddxerx=rerx.\frac{d}{dx}e^{rx}=re^{rx}.

也就是说,它是方程

y=ry,y(0)=1y'=ry,\qquad y(0)=1

的解。这个角度很适合拿来解释复指数:如果 rr 可以是实数,为什么不能问一问 r=ir=i 时方程的解是什么?

于是考虑

z=iz,z(0)=1.z'=iz,\qquad z(0)=1.

这里要停一下,不急着写答案。先看这行式子的几何意思。

在 Argand 图上,复数 z=x+iyz=x+iy 可以看成平面上的点或向量 (x,y)(x,y)。乘以 ii 会发生什么?

i(x+iy)=y+ix.i(x+iy)=-y+ix.

也就是

(x,y)(y,x).(x,y)\mapsto(-y,x).

这个变换就是逆时针旋转 9090^\circ。例如 11 变成 iiii 变成 1-11-1 变成 i-i。如果学生已经画过 Argand 图,让他们亲手标一下,比听老师说一遍有用。

所以

z=izz'=iz

的意思是:点的位置是 zz,它的速度 zz' 永远等于把当前位置旋转 9090^\circ 后得到的向量。

换成人话说,速度始终与位置垂直。

这就是圆周运动的图像。一个点从 11 出发,速度总是沿着半径的垂直方向走,它不会往外跑,也不会往里掉,只会绕着原点转。这个说法先作为直观解释就够了,严格证明可以暂时放下。

接下来再算。设

z(θ)=x(θ)+iy(θ).z(\theta)=x(\theta)+iy(\theta).

代入 z=izz'=iz

x+iy=i(x+iy)=y+ix.x'+iy'=i(x+iy)=-y+ix.

比较实部和虚部,得到

x=y,y=x.x'=-y,\qquad y'=x.

再求一次导数:

x=y=x,y=x=y.x''=-y'=-x,\qquad y''=x'=-y.

这时学生熟悉的三角函数回来了。初始条件 z(0)=1z(0)=1 表示

x(0)=1,y(0)=0.x(0)=1,\qquad y(0)=0.

x=y, y=xx'=-y,\ y'=x 还得到

x(0)=0,y(0)=1.x'(0)=0,\qquad y'(0)=1.

满足

x=x,x(0)=1,x(0)=0x''=-x,\quad x(0)=1,\quad x'(0)=0

的函数是 cosθ\cos\theta;满足

y=y,y(0)=0,y(0)=1y''=-y,\quad y(0)=0,\quad y'(0)=1

的函数是 sinθ\sin\theta。所以

z(θ)=cosθ+isinθ.z(\theta)=\cos\theta+i\sin\theta.

另一方面,如果我们把“erθe^{r\theta}”理解成微分方程

z=rz,z(0)=1z'=rz,\qquad z(0)=1

的解,那么当 r=ir=i 时,这个解就记作 eiθe^{i\theta}。于是

eiθ=cosθ+isinθ.e^{i\theta}=\cos\theta+i\sin\theta.

到这里,eiθe^{i\theta} 不是凭空等于三角函数。我们只是把指数函数“求导后只改变比例”的性质延伸到 r=ir=i,然后解出来的运动正好绕着单位圆走。

很多老师讲到这里,会顺手说:所以 eiθe^{i\theta} 表示旋转。

这句话可以说,但太早说,学生仍然会觉得老师在命名。先让他们看见几件具体的事:

乘以 ii 把向量旋转 9090^\circ

z=izz'=iz 表示速度始终是位置旋转 9090^\circ 后的方向。

z=x+iyz=x+iy 拆开后,实部和虚部分别满足 x=x, y=yx''=-x,\ y''=-y,于是 cos\cossin\sin 出现了。

这时再说“旋转”,它才像是刚才那串计算的简写。

再往外推一步:增长和旋转可以叠在一起

Section titled “再往外推一步:增长和旋转可以叠在一起”

有了这个入口,再讲

e(a+bi)x=eaxeibxe^{(a+bi)x}=e^{ax}e^{ibx}

就不必把它讲成另一个神奇公式了。

可以先说得朴素一点:aa 负责实指数那部分,带来增长或衰减;bibi 负责虚指数那部分,带来旋转或振荡。合在一起,就是一边放大或缩小,一边转。

所以当二阶微分方程的特征根是

a±bia\pm bi

时,解里出现

eaxcosbx,eaxsinbxe^{ax}\cos bx,\qquad e^{ax}\sin bx

并不奇怪。eaxe^{ax} 是外面的包络,cosbx,sinbx\cos bx,\sin bx 是里面的振荡。学生如果以后学阻尼振动,这条线会非常有用。

这节课不需要碰一般复变量。目标很窄:先让 ii 不再像硬规定,再让 eiθe^{i\theta} 不再像黑箱。做到这两点,后面的欧拉公式、特征根、阻尼振动都会少一点背诵味。

我会先用三次方程制造麻烦。

如果一个方程有实数解,但公式中间出现 121\sqrt{-121},我们应该说公式坏了,还是数系不够用了?x315x4=0x^3-15x-4=0 足够用了。让学生先验证 x=4x=4,再展示卡尔达诺公式会把负数开平方摆出来。不完整推导公式,只展示矛盾现场。

然后讲 Bombelli 的课堂简化版:有些“非法”的中间量,按一致的规则算下去,最后会合成实数。这里要说清楚,我们不是在复原完整历史,只是在借这个例子说明复数为什么会被迫出现。

接着转到 Argand 图。i(x+iy)=y+ixi(x+iy)=-y+ix,所以乘以 ii 是旋转 9090^\circ。这一步要画图,不要只写公式。

最后用 z=iz, z(0)=1z'=iz,\ z(0)=1 推出 x=y, y=xx'=-y,\ y'=x,再推出 x=x, y=yx''=-x,\ y''=-y。等 cos\cossin\sin 自己出现以后,再给出 eiθ=cosθ+isinθe^{i\theta}=\cos\theta+i\sin\theta。太早写欧拉公式,它只是漂亮结论;晚一点写,它才像是算出来的东西。

第一种,是把复数的第一句话讲成“我们规定 i2=1i^2=-1”,然后马上开始代数运算。这样效率很高,但学生会以为数学就是老师批准某些符号合法。

第二种,是把欧拉公式当成漂亮结论直接抛出来。对已经理解的人,它当然漂亮;对还没走过这条路的学生,它只是更高级的黑箱。

这篇用 AI 备课,我会只让它查两件事。

一是历史边界。把三次方程和 Bombelli 那段写出来,问它:哪些说法是课堂简化,哪些历史细节需要课前核查?不要让它把简化版讲成完整史实。

二是推导顺序。把 z=iz, z(0)=1z'=iz,\ z(0)=1 的板书草稿贴进去,问它:从乘以 ii 是旋转 9090^\circ,到 x=y, y=xx'=-y,\ y'=x,再到 x=x, y=yx''=-x,\ y''=-y,有没有哪一步跳得太快?

AI 在这里适合帮忙查缝,不适合替你写“复数的意义”。那种话一旦写大,就很容易空。