日志

科普：作用量原理与欧拉-拉格朗日方程简洁推导

热度 2已有 11756 次阅读2014-5-9 05:43 |个人分类:科普|系统分类:科技| 相对论, 经典, 力学, 宇宙

如果有人问你宇宙间最基本的规律是什么？你如果回答，就两条：（1）作用量原理；（2）规范不变原理，听者会感到相当满意，就两条原理囊括了宇宙所有规律，简洁、优美。

我在前面提到过费马原理：光总是走时间最短的路径。由此，我们简单地推导出了折射定理。光走时间最短的路径，那么其他物体或者系统又有什么规律呢？令人惊奇的是，所有其他的物理规律，从牛顿力学，到电磁理论到广义相对论，到量子场论，都是基于作用量原理。整个经典物理的基本原理就是作用量最小。

要说明什么是作用量，先得引入一个称为拉格朗日量的东西。拉格朗日量是物体的坐标q，与q随时间变化速度 [ix]\dot{q}[/ix]的函数，我们用[ix]L(q, \dot{q})[/ix]表示。在牛顿力学中L等于系统的动能减去势能 L = T-V。以一个自由落体为例， [ix]L = \frac{1}{2} m v^2 - mgy[/ix]，其中y是物体的高度，而v是速度。作用量则等于拉格朗日量乘以时间。当然，由于拉格朗日量是变化的，所以你得把时间切割成小段，计算小段时间的作用量，然后加起来。这叫做积分。

最小作用量原理是：一个系统从起始状态到最终状态所经历的过程作用量最小。举个例子，你向上扔个皮球，理论上皮球可以在空中盘旋一阵再掉下来，但如果你计算这个情况的作用量，会发现它不是最小。一旦你写出一个系统的拉格朗日量，整个系统的运动方程就成为一个单纯的计算问题了。相关的方程叫做欧拉-拉格朗日方程。相关的数学称为变分法。相关的推导直观上非常不好理解---系统怎么会像有第六感觉似自己选择让作用量最小呢？这个问题要用量子理论中的路径积分才能解释。

不过这里，我们至少可以把数学搞简单一点。我们按照前面从时间最短退出折射定理的方法，简单推出欧拉-拉格朗日方程。

假设系统的拉格朗日量为 [ix]L (q, \dot{q})[/ix]。我们在其最优路线中随意取时间间隔为[ix]\Delta{t}[/ix]的三点 A,B,C，其坐标分别为 [ix] q_A, q_B, q_C[/ix]。那么，从A到B，[ix]\dot{q}_{AB} = \frac{q_B- q_A}{\Delta{t}}[/ix]; 从B到C，[ix]\dot{q}_{BC} = \frac{q_C- q_B}{\Delta{t}}[/ix]; 为简化符号，令[ix]q_{AB} = \frac{q_A+q_B}{2}, q_{BC} = \frac{q_B+q_C}{2}, [/ix]。因此，从A到B到C这段的作用量是

\begin{equation} \begin{split} A &= L(\frac{q_A+q_B}{2}, \frac{q_B-q_A}{\Delta{t}}) \Delta{t} + L(\frac{q_C+q_B}{2}, \frac{q_C-q_B}{\Delta{t}}) \Delta{t}\\ & = \Delta{t}\left[ L(q_{AB}, \dot{q}_{AB}) + L(q_{BC}, \dot{q}_{BC}) \right] \end{split} \end{equation} .

如果我们将中间点B的坐标做一个微小的变化到[ix]q_B +\delta[/ix]，新的作用量是

\begin{equation} \begin{split} A^\prime &= L(\frac{q_A+q_B+\delta}{2}, \frac{q_B+\delta-q_A}{\Delta{t}}) \Delta{t} + L(\frac{q_C+q_B+\delta}{2}, \frac{q_C-q_B-\delta}{\Delta{t}}) \Delta{t} \\ &= \Delta{t} \left[ L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) \right] \end{split} \end{equation}

由于A-B-C是作用量最小的路径，中间点做微小变化时，作用量应该不变，[ix]A^\prime -A \approx 0 [/ix]。

\begin{equation} \begin{split} \frac{A^\prime -A}{\Delta{t}} & = L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) - \left[ L(q_{AB}, \dot{q}_{AB}) + L(q_{BC}, \dot{q}_{BC}) \right] \\ & = L(q_{AB}+\delta/2, \dot{q}_{AB} + \frac{\delta}{\Delta{t}}) - L(q_{AB}+\delta/2, \dot{q}_{AB} ) + L(q_{AB}+\delta/2, \dot{q}_{AB} ) \\ & \quad + L(q_{BC}+\delta/2, \dot{q}_{BC} - \frac{\delta}{\Delta{t}}) - L(q_{BC}+\delta/2, \dot{q}_{BC}) + L(q_{BC}+\delta/2, \dot{q}_{BC}) \\& \quad -L(q_{AB}, \dot{q}_{AB}) -L(q_{BC}, \dot{q}_{BC}) \\& = \frac{\partial{L}}{\partial{\dot{q}}}|_{AB} \frac{\delta}{\Delta{t}} + \frac{\partial{L}}{\partial{q}}|_{AB} \frac{\delta}{2}-\frac{\partial{L}}{\partial{\dot{q}}}|_{BC} \frac{\delta}{\Delta{t}} + \frac{\partial{L}}{\partial{q}}|_{BC} \frac{\delta}{2} \\ & =-\left[\frac{\frac{\partial{L}}{\partial{\dot{q}}}|_{BC}-\frac{\partial{L}}{\partial{\dot{q}}}|_{AB}}{\Delta{t}} - \frac{\partial{L}}{\partial{q}}|_B \right]\delta \end{split} \end{equation}

上面的方括号中的第一项就是[ix]\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}[/ix]，对于稳定路径，作用量变化为0，因此，

[ix]\begin{equation}\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}-\frac{\partial{L}}{\partial{q}}=0\end{equation}[/ix]

或者，[ix]\begin{equation}\frac{\partial{L}}{\partial{q}}=\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q}}}\end{equation}[/ix]。

在纸上写比较清楚。在屏幕上敲，眼睛看花了，先喘口气。