如果有人问你宇宙间最基本的规律是什么? 你如果回答,就两条:(1)作用量原理;(2)规范不变原理,听者会感到相当满意,就两条原理囊括了宇宙所有规律,简洁、优美。
我在前面提到过费马原理: 光总是走时间最短的路径。由此,我们简单地推导出了折射定理。光走时间最短的路径,那么其他物体或者系统又有什么规律呢? 令人惊奇的是,所有其他的物理规律,从牛顿力学,到电磁理论到广义相对论,到量子场论,都是基于作用量原理。整个经典物理的基本原理就是作用量最小。
要说明什么是作用量,先得引入一个称为拉格朗日量的东西。拉格朗日量是物体的坐标q,与q随时间变化速度 [ix]\dot{q}[/ix]的函数,我们用[ix]L(q, \dot{q})[/ix]表示。在牛顿力学中L等于系统的动能减去势能 L = T-V。以一个自由落体为例, [ix]L = \frac{1}{2} m v^2 - mgy[/ix],其中y是物体的高度,而v是速度。作用量则等于拉格朗日量乘以时间。当然,由于拉格朗日量是变化的,所以你得把时间切割成小段,计算小段时间的作用量,然后加起来。这叫做积分。
最小作用量原理是:一个系统从起始状态到最终状态所经历的过程作用量最小。举个例子,你向上扔个皮球,理论上皮球可以在空中盘旋一阵再掉下来,但如果你计算这个情况的作用量,会发现它不是最小。一旦你写出一个系统的拉格朗日量,整个系统的运动方程就成为一个单纯的计算问题了。相关的方程叫做欧拉-拉格朗日方程。相关的数学称为变分法。相关的推导直观上非常不好理解---系统怎么会像有第六感觉似自己选择让作用量最小呢?这个问题要用量子理论中的路径积分才能解释。
不过这里,我们至少可以把数学搞简单一点。我们按照前面从时间最短退出折射定理的方法,简单推出欧拉-拉格朗日方程。
假设系统的拉格朗日量为 [ix]L (q, \dot{q})[/ix]。我们在其最优路线中随意取时间间隔为[ix]\Delta{t}[/ix]的三点 A,B,C,其坐标分别为 [ix] q_A, q_B, q_C[/ix]。那么,从A到B,[ix]\dot{q}_{AB} = \frac{q_B- q_A}{\Delta{t}}[/ix]; 从B到C,[ix]\dot{q}_{BC} = \frac{q_C- q_B}{\Delta{t}}[/ix]; 为简化符号,令[ix]q_{AB} = \frac{q_A+q_B}{2}, q_{BC} = \frac{q_B+q_C}{2}, [/ix]。因此,从A到B到C这段的作用量是
\begin{equation}
\begin{split}
A &= L(\frac{q_A+q_B}{2}, \frac{q_B-q_A}{\Delta{t}}) \Delta{t} +
L(\frac{q_C+q_B}{2}, \frac{q_C-q_B}{\Delta{t}}) \Delta{t}\\
& = \Delta{t}\left[ L(q_{AB}, \dot{q}_{AB}) +
L(q_{BC}, \dot{q}_{BC}) \right]
\end{split}
\end{equation} .
如果我们将中间点B的坐标做一个微小的变化到[ix]q_B +\delta[/ix],新的作用量是
\begin{equation}
\begin{split}
A^\prime &= L(\frac{q_A+q_B+\delta}{2}, \frac{q_B+\delta-q_A}{\Delta{t}}) \Delta{t} +
L(\frac{q_C+q_B+\delta}{2}, \frac{q_C-q_B-\delta}{\Delta{t}}) \Delta{t}
\\ &= \Delta{t} \left[ L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) \right]
\end{split}
\end{equation}
由于A-B-C是作用量最小的路径,中间点做微小变化时,作用量应该不变,[ix]A^\prime -A \approx 0 [/ix]。
\begin{equation}
\begin{split}
\frac{A^\prime -A}{\Delta{t}} & = L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) -
\left[ L(q_{AB}, \dot{q}_{AB}) + L(q_{BC}, \dot{q}_{BC}) \right]
\\ & = L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) - L(q_{AB}+\delta/2, \dot{q}_{AB} ) + L(q_{AB}+\delta/2, \dot{q}_{AB} )
\\ & \quad + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) - L(q_{BC}+\delta/2, \dot{q}_{BC}) + L(q_{BC}+\delta/2, \dot{q}_{BC})
\\& \quad -L(q_{AB}, \dot{q}_{AB}) -L(q_{BC}, \dot{q}_{BC})
\\& = \frac{\partial{L}}{\partial{\dot{q}}}|_{AB} \frac{\delta}{\Delta{t}} + \frac{\partial{L}}{\partial{q}}|_{AB} \frac{\delta}{2}-\frac{\partial{L}}{\partial{\dot{q}}}|_{BC} \frac{\delta}{\Delta{t}} + \frac{\partial{L}}{\partial{q}}|_{BC} \frac{\delta}{2}
\\ & =-\left[\frac{\frac{\partial{L}}{\partial{\dot{q}}}|_{BC}-\frac{\partial{L}}{\partial{\dot{q}}}|_{AB}}{\Delta{t}} - \frac{\partial{L}}{\partial{q}}|_B \right]\delta
\end{split}
\end{equation}
上面的方括号中的第一项就是[ix]\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}[/ix],对于稳定路径,作用量变化为0, 因此,
[ix]\begin{equation}\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}-\frac{\partial{L}}{\partial{q}}=0\end{equation}[/ix]
或者,[ix]\begin{equation}\frac{\partial{L}}{\partial{q}}=\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}\end{equation}[/ix]。
在纸上写比较清楚。在屏幕上敲,眼睛看花了,先喘口气。