数学是物理学家用来描述自然规律的语言。如果你想理解物理学,就必须学习大量的数学。如果要挑选一个最重要的、用来理解物理学的公式,那就是泰勒公式(Taylor's formula)。
让我们从数学开始,理解这个公式的一切。假设有某个函数f(x),
它看起来真的很复杂,但我们不尝试一下子理解整个复杂的函数,而是看它在一个更小区域内的情况,这样就简单多了。
选择x=0为原点,所以x=0处的函数高度是f(0)。
想象这条曲线是一座危险山脉的形状,而你是一个探险家,在制定它的地图。由于大雾笼罩,你无法看得很远。你只能小心地沿着山走,并使用一个高度计来测量你离地面的高度,以此记录它的形状。从这一点x=0开始,你的起始高度是f(0)。就你所知,整座山可能只是在这个高度的一个平坦的水平线。然后,当你尝试在写下一个描述山的高度的函数时,你的第一个猜测就是f(x) = f(0)。
但当你稍微向右走了一下,你发现山的高度已经变化了。所以,它实际上并非一条水平线。就目前你所能看到的,它看起来像一条倾斜的线,斜率由f在x等于0处的一阶导数给出。
现在,你对高度函数的新的最佳猜测是这条倾斜线的方程:
现在,你再向右走一下,你发现曲线不是一条直线。相反,它开始像抛物线一样偏离直线。
所以现在你预计,函数有一个更好的近似,带有x的平方项
你可能发现,通过包含x的更多幂——x的3次幂、4次幂等等,可能能得到一个关于函数的更好描述。
现在,你想将函数f表示为x的幂的和,有系数c0、c1、c2等等。问题是如何选择这些数字,使得这个级数与f相匹配得很好。我们已经看到前几个系数是什么了,当代入x=0,除了第一项其它所有项都消失,得到
因此,级数中的第一个数字是起始点x=0处的函数值。至于c1,我们先取导数,得到
现在,当我们代入x=0,c1项保留下来
如果再次取导,得到
因此,当代入x=0,得到
如此反复,对于求和中的x的n次幂项,需要取n次导数,每次导数都带下一个幂——首先是n,然后是n-1、n-2,以此类推,一直到3、2、1。
所以第n个系数是
我们已经将函数f写为x的幂的和,
当x非常小时,每个x的更高次幂比之前的还要小得多,所以仅通过保留级数中的前几项就已经得到了一个很好的近似。随着x离x=0越来越远,为了得到函数的一个好描述,需要在级数中加入更多的项。有了系数的一般公式,我们可以加入尽可能多的项。当n变大时,级数近似与曲线的匹配越来越好。
这是非常了不起的。这意味着如果我们知道在一个点上一个平滑函数的所有导数,就可以重构出函数在其他地方的形状。下面是几个常见的泰勒函数展开式,
通常在物理学中我们并不真的关心整个泰勒级数,我们真正想要的是一个复杂函数的好的近似,使问题更简单去解决。
物理学
第一个问题是,如何简化复杂的物理方程?在经典力学中解决问题的基本步骤是写下粒子上的所有力,然后加它们起来,写下
然后求解这个方程,找到粒子的位置作为时间的函数。这说起来容易但做起来难,尤其是最后一步解方程,因为除了最简单的系统外,这个方程通常难以精确解决。
F=ma 是一个微分方程。微分方程比我们在中学和高中学到的代数方程要难解得多。一个简单的例子,就是单摆(Pendulum),
在求摆的运动时,我们主要关心的力是粒子轨迹的切线方向的重力分量,即
其中θ 是摆与垂直轴形成的角度。那么F=ma 可以写成θ 关于时间的二阶导数,
尽管这个物理系统看起来很简单,但由于这个sinθ因子,这个方程已经变得非常复杂,sinθ使它成为一个非线性微分方程,尝试求解可能会非常棘手。另一方面,当θ 很小时,你可以想象一个单摆轻轻地来回摇晃,就像一个钟摆。那么当θ相对较小时我们是否可能简化这个方程呢?泰勒级数让我们能做到这一点,因为
对于很小的θ,可以近似为,
这个复杂的F=ma 方程变得大为简化,因为让这个方程成为非线性微分方程的sinθ因子消失了。通过应用泰勒级数,我们能够线性化这个微分方程,使我们能够在单摆离平衡点不太远时更容易解决。
这就是一个简谐振荡器的方程,就像一个弹簧上的质量,一般解是正弦和余弦的和,
其中角频率为
因此,这个单摆确实会轻轻地来回摆动。所有,我们在任何物理问题中应该首先做的是用泰勒级数在一个稳定平衡点附近展开势能函数
在这里我选择我的坐标,使得平衡点在x=0处。第一个项U(0)只是一个常数,无关紧要。你总是可以改变势能函数的基准面,并将这个常数消除。同时,第二个项也消失了,因为我们选择在势能的最小值点(U等于0的地方)进行展开。因此,在平衡附近的势能的泰勒展开的第一个需要注意的项通常是二次项,这就像一个在弹簧上的质量的势能一样,
这就是系统在其平衡位置附近来回振荡的原因。至于力,它与势能通过
关联,因此,在平衡附近粒子上的力的泰勒级数从
开始,这又恰好像弹簧力−kx。特别是,力是线性的。所以,在稳定平衡点附近展开势能的技巧,实际上就是线性化F=ma 方程。
第二个问题是,爱因斯坦的广义相对论的牛顿极限。在牛顿力学中,一个自由粒子的动能是
另一方面,如果我们代入动量p=mv,我们可以写出同样的表达式,即
这是一个具有动量p的非相对论自由粒子的能量。非相对论意味着粒子的速度与光速相比非常小。当粒子接近光速时,会发生一些奇怪而荒诞的事情,这在大约100多年前被爱因斯坦在他的广义相对论中发现。在广义相对论中,一个质量为m、动量为p的自由粒子的能量由这个新公式给出:
其中c 是光速。即使你从未研究过广义相对论,你之前也见过这个,因为如果粒子处于静止状态,即p 等于0,我们得到
这可能是物理学中最著名的方程。但是,当粒子在移动时,我们需要这个更一般的公式,包括来自动量的贡献。这个公式即使粒子的速度接近光速也成立。另一方面,我们知道当p很小时,能量应该是什么。那么我们如何看到爱因斯坦的公式正确地再现了牛顿的慢运动粒子的公式呢?当然,想法是当p很小时,应用爱因斯坦能量公式的泰勒展开。
首先,让我们提取出mc^2,像这样写出整个表达式
这样就清楚地表明,我们现在要做的是计算下面这个函数的泰勒级数(当x很小时),
其中,x为
这种类型的泰勒级数在物理学中经常出现,一般的形式为,
在这个例子中,q=1/2。这种类型函数的泰勒展开式为,
回到相对论性能量,只需插入q=1/2和
得到
第一项是E=mc^2,这是相对论中的静止粒子的能量,它在牛顿力学中没有直接类比。但另一方面,这只是一个常数,你总是可以在牛顿力学中向总能量添加一个常数。至于第二项,我们看到泰勒级数如何精确地再现我们在牛顿力学中预期的动能。
泰勒级数中的下一项是,
这该如何理解呢?重点是,牛顿力学是对那些远小于光速运动的粒子的一个很好的描述,但这只是一个近似。这一项是牛顿能量在与光速相比速度微小的情况下的首要相对论修正。而这个额外的项给出了牛顿结果的一个非常小的修正,我们可以在不失太多准确性的情况下忽略它。但是,当速度变大时,这个修正变得越来越重要。我们可以在氢原子的结合能中看到这个修正的影响。这是用来将电子从它的“轨道”中踢出去的能量。
下面,我向你们展示如何只通过应用量纲分析就可以得到结合能答案的90%。首先,列出可以使用的参数及其单位,并看看如何将它们组合起来得到我们想要的单位。在这种情况下,我们看到我们可以将电子质量、其电荷、库仑常数和普朗克常数组合起来得到能量单位,
这样一来,氢原子的结合能就必须与此成比例,
只是像这样考虑单位就让我们接近答案了。实际上,结合能的公式带有一个二分之一的系数,我们不能只通过考虑量纲就能得到它,因为2没有任何单位。这是波尔的氢结合能的公式,
它是量子力学的第一个伟大成就之一。它的数值值约为13.6电子伏特,与结合能的实验值非常接近。然而,波尔的公式只是一个近似,它忽略了由于广义相对论产生的可实验观察到的效应。
但量纲分析的问题出在了哪里?问题在于,在写下结合能的非相对论近似时,我们省略了光速c。因此,如果想要包括广义相对论的效应,需要考虑c是如何进入能量公式的。但是,当我们把c 添加到参数列表中时,会发生一些非凡的事情,得到一个无量纲的组合,
这个组合被称为精细结构常数(Fine structure constant)。如果带入数字,会发现α 约等于0.0073,或约等于1除以137。由于α 是无单位的,量纲分析不会告诉我们它在能量公式中是如何出现的。
这是如何允许相对论对波尔公式进行小的修正的。但是,我们可以通过考虑相对论修正获得一个更好的理论预测,那就是我们通过将泰勒级数应用于爱因斯坦的公式所得出的那个首要的相对论修正。我们可以确定相对论给波尔公式做出的小的修正。细节需要量子力学,所以在这里不会深入讨论。
第三个问题是,泰勒公式与量子力学中动量定义的关系。在经典力学中,主要问题是求解作为时间函数的粒子轨迹x(t)。另一方面,在量子力学中,目标是找到波函数
以及它如何随时间演变。在进行测量时,波函数或者它的平方越大,你就越有可能在那个位置找到粒子。我们测量粒子的那些量物,比如它的位置和动量,由作用在波函数上的算符表示。测量位置的算符写为
测量动量的算符写为
动量算符与空间平移密切相关,所以让我们定义一个算符,
它将波函数移动ε,
抛开物理,这看起来很熟悉,ψ(x) 只是一个函数,这个公式告诉我们我们在寻找一个将ψ(x) 移到ψ(x−ϵ) 的算符,那正是泰勒公式的作用。因此,我们识别移位算符
由于我们现在不会深入探讨的原因,这个移位算符与动量算符通过
关联,对比两边,泰勒公式告诉我们我们应该将量子力学中的动量算符识别为
当你开始学习量子力学时,这将是你将学习的第一个公式之一。它直接来自泰勒公式。
这只是泰勒公式出现的物理应用的一小部分,你会在每个地方都看到泰勒公式。