You are on page 1of 14

5自然科学史研究 6 第 28卷 第 3期 ( 2009年 ): 312) 325

S tud ies in the H istory of N atural Sciences V o.l 28 N o. 3( 2009)

变分法的一次变革:
从欧拉到拉格朗日的形式化改造
贾小勇
( 重庆文理学院 数学与统计学院, 重庆 402160 )

李跃武
( 甘肃省合作民族师范高等专科学校 数学系, 甘肃 合作 747000)

摘 要 从欧拉方法发展到拉格朗日方法, 其中蕴含着变分法的重大变革。
在研读原始文献的基础上, 以 / 为什么数学 0为切入点和主要目的, 对欧拉和拉
格朗日的研究方法进行分析和比较, 重点探讨拉格朗日 D-算法产生的数学背景、
形成过程及重大影响。拉格朗日以摆脱几何直观和简化计算为目标, 以消除欧
拉方法中微分符号 d 的双重意义和混用现象为切入点, 通过引进符号 D
, 借助于
形式的类比和反复的推演, 提炼出运算规则, 最终发明了 D-算法。因此拉格朗日
对变分法所作的变革, 是形式化改造的产物。而这种形式化改造的成功, 对 18
世纪微积分学从几何形态向 / 代数分析 0形态的过渡、
几何论证向分析论证的转
变起到了不可忽视的推动作用; 同时在一定意义上也增进了对符号的信任程度。
对变分法历史的这种探究, 为全面理解 18 世纪数学发展的特点提供了一个新
视角。
关键词 变分法 欧拉 拉格朗日 形式化
中图分类号 N091BO11
文献标识码 A 文章编号 1000- 0224( 2009) 03-0312- 14

0 引 言

变分法是研究泛函 (即函数的函数 )极值问题的一个分析学分支, 在 20世纪以前, 泛


函通常以积分的形式呈现, 因而此时的变分法主要用来研究积分极值问题。虽然古典等
周问题等属于变分法的问题很早就产生了, 但变分法作为一门数学分支, 真正发端于 17
世纪末、18世纪初由最速降线问题所引发的一系列挑战。在牛顿 ( Issac N ew ton, 1643)

收稿日期: 2007- 04-20; 修回日期: 2008- 07-25


作者简介: 贾小勇, 1970 年生, 甘肃通渭人, 重庆文理学院数学与统计学院副 教授, 主要 从事近现代数学史研究;
李跃武, 1972年生, 甘肃临洮人, 甘肃合作民族师范高等专科学校数学系讲师, 主要从事近现代数学史研究。
基金项目: 国家自然科学基金 (项目编号: 10771169)
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 313

雅可布 # 伯努利 ( Jacob Bernoull,i 1654) 1705年 )、约翰 # 伯努利 ( John B ernou-
1727年 ) 、 l
l,i 1667) 1748年 ) 、
泰勒 ( B rook T ay lor, 1685) 1731年 ) 等先驱者富有竞争性的探索基础
上, 欧拉 ( L eonhard Euler, 1707) 1783年 ) 从 1728年起, 开始了在变分法领域的研究。
1744年, 欧拉对其研究成果进行了系统总结和改进, 撰写并出版了数学史上第一本
变分法专著 ) ) ) 5求某种具有极大或极小性质的曲线或解最广义的等周问题的技巧 6 ( 以
下简称 5技巧 6 )
[ 1]
。在这部被卡拉泰奥多里 ( Constantin Carath†
odo ry, 1873) 1950年 ) 称
为 / 迄今所写最优美的数学著作之一 0 的书中, 欧拉首次给出了变分问题的清晰而一般
[ 2]

的表述, 确认了变分问题的解所满足的一些基本方程的标准形式, 并提供了推导这些方程


的一般方法, / 将变分法从对一些具体问题的讨论转变为非常一般的问题的讨论 0 ( [ 3],
68页 ) 。
5技巧 6是变分法发展史上的一座里程碑, 标志着变分法作为一个新的分析学分支的
诞生。然而, 由于欧拉在此书中使用了大量的几何论证, 其几何和分析相结合的方法使得
具体的推理过程非常繁复。欧拉本人也期待着能有一种不依赖于几何直观的改进方法,
并为此付出了很多精力。
这种新方法的发现者是拉格朗日 ( Joseph Louis L agrange, 1736) 1813年 )。 1755年 8
月 12日, 年仅 19岁的拉格朗日给欧拉写信, 阐述了这种新方法 ) ) ) D-算法。在信中, 他
不仅介绍了他的算法, 而且还用其解决了 5技巧 6中所列的基本变分问题, 展示了该方法
[ 4]
的优越性 。拉格朗日的方法是一种纯分析的方法, 无需借助任何几何直观, 通过引进
新的符号 D及其运算规则, 使得整个演算过程简洁、
优美。更为重要的是, 这种方法包含
着一种极大的变革, 把自牛顿以来通过改变极值曲线上个别纵坐标以获取比较曲线的方
法, 转变为通过整条曲线的改变来获得比较曲线, 由此创立了一般意义上的变分方法, 使
变分法的研究走上了一条与欧拉及其他前辈数学家不同的路线, 将早期变分法的发展推
进到一个新阶段。
[ 5]
1755年 9月 6日, 欧拉给拉格朗日回信, 高度赞扬了拉格朗日的方法 。随后欧拉
¹
放弃了自己原来的方法 , 转而运用拉格朗日的演算方法, 并在 1764年的两篇论文中, 将
[ 6, 7] º
这门数学分支正式命名为 / 变分法 0 ( calcu lu s of variations) , 从此拉格朗日的变分演
算成了古典变分法的标准算法。
从欧拉方法过渡到拉格朗日方法是变分法发展过程的一次重大变革。那么, 拉格朗
日为什么要对欧拉的方法进行变革? 为什么会提出其 D
-算法? 他从欧拉的研究中受到哪
些启示? 他又是如何发现新方法的? 其发现对他以后的科学研究产生了怎样的影响? 这
些问题对于再现欧拉和拉格朗日的数学思想以及揭示变分法早期的发育、
发展过程等具
有极为重要的理论意义和历史意义。

¹ 欧拉的方法孕育了现代变分法中的直接方法, 20世纪以来, 直接方法得到 了充分发展, 在 寻求变分问题及 相


应的微分方程的精确或近似解中获得了极大的应用。
º / 变分法 0这一名词最早正式出现在欧拉的两篇论文中: 5变分演算基础 6 ( E lem ents ca cu li Varia tionum )与 5极
大值和极小值的分析解释 6 (Ana lytica Exp lica tio M aximorum et M in im orum )。虽 然这两 篇论 文正式 发表是 在
1764 年的 5彼得堡科学院汇刊 6中, 但根据 纪录显 示, 欧拉 曾于 1756年 9 月在 柏林科 学院 宣读过 这两篇 论
文, 由此我们可以看出欧拉不失时机地给拉格朗日的这一新方法命了名。
314 自 然 科 学 史 研 究 28卷

[ 8]
给历史上的重大数学发现或变革 寻找历史根据是数学史研究的基本任 务之一 。
特别是对于近现代数学史的研究, 除了采用历史主义的原则, 搞清楚历史上的数学是如何
做出来的, 还需要在现有研究的基础上, 对当时的数学家提出数学问题、 引进新的数学概
念和符号、 创造新的数学、新的方法的原因, 进行深入研究。不过, 就笔者所知, 目前国内
[ 3, 9) 13]
外有关变分法历史的文献中 , 大多把注意力放在欧拉和拉格朗日各自方法的讨论
及阐述上, 根据这些研究, 我们大体上知道了欧拉与拉格朗日各自的算法, 但是, 还没有人
从 / 拉格朗日为什么要对欧拉的变分法进行变革 0的角度进行系统考察和分析。
有鉴于此, 本文在研读 5技巧 6、拉格朗日 1755年 8月 12日给欧拉的信以及欧拉的回
信等原始文献的基础上, 以 / 为什么数学 0为切入点和主要目的, 对其进行探讨和分析。

1 欧拉的几何-分析法

欧拉的几何-分析法主要体现在他对 5技巧 6一书所列变分问题的基本微分方程的推


导上, 下仅选择其中两类具有代表性的问题加以考察, 拉格朗日就是以其为主要考察对象
来阐明创新方法的威力 ¹ 。
111 第一类问题基本方程的推导

问题: 在所有平面曲线 y = y ( x )中 º , 寻求一条曲线, 使得定积分 Q


Zdx 取极大或极小

值, 其中 Z 是 x, y, p (p = dy /dx )的函数, 并且从 A (不妨假定其横坐标为 x = 0)到 Z (不妨


假定其横坐标为 x = a )进行积分 (图 1) » 。

图 1 欧拉 5技巧 6中建立基本方程的示意图
( 采自: 文献 [ 1] 最后附页中的图 4 )

¹ 拉格朗日在 1755年 8月 12 日的信中, 主要以 5技巧 6中的 3 个基本问 题 ( 即第 2 章的命题 Ó 、第 3 章的命 题


Ó 和 Õ ) 为例来说明 D-算法的优越性。本文中, 为了叙述简单起 见, 我们只选择 第 2 章和第 3章 的命题 Ó 来
阐明欧拉和拉格朗日各自的方法。
º 5技巧 6不太注意端点的指定, 其实这里他隐含地假定了曲线均通过 a、z两固定点。
» 欧拉在符号的使用上有些混乱, 他用 Z 一方面表示被积函数, 另一方面又表示积分区间的端点。但根据上 下
文, 很容易将这两种用法区别开来, 为了尽量保持欧拉分析的原貌, 我们在此文中也尽量采用其原来记号。
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 315

5技巧 6第 2章主要讨论了这种类型的问题 ¹ 。他首先把横坐标 AZ 等分成 / 无限 0多

个子区间: dx = IK = KL = LM = ,, 然后假设连接两点 a、z 的曲线给出积分 Zdx 的极大或 Q


极小值, 字母 M、
N、O 代表区间 AZ 上无限接近的三个点, 字母 m、n、o 分别代表此曲线上
N n、Oo的三点, 记 AM = x, AN = x c, AO = xd; Mm = y, Nn = y c, Oo = y d, 因而由
纵坐标为 Mm、
p = dy /dx 得:
y c- y y d- yc
p= , p c= ( 1)
dx dx

欧拉将区间 AZ 上的定积分 Zdx 改写成如下形式 Q


QZdx + Zdx + Z cdx + ,
M
º
A

其中 Z, Z c, ,分别表示被积函数 Z 在 ( x, y, p )和 (x c, y c, p c), ,的值, 将积分 Zdx 看成是 Q


y c的函数, 给纵坐标 yc一个无穷小的增量 nv » , 由于积分 Zdx沿曲线 az取极大或极小值, Q
那么由此导致的积分 Zdx 的变化为 0。 Q
对于积分 Zdx 而言, 由于 yc的变化而受到影响的 Q
部分只有以下两项:
Zdx + Z cdx = (Z + Z c) dx ( 2)
欧拉记
dZ = M dx + Ndy + Pdp, dZ c= M cdx + N cdy c+ P cdp c¼ ( 3)
然后他将 ( 3) 中的这些微分解释为当 y c增加 nv时, Z, Z c, x, y, y c, p, pc所发生的变化。由
( 1) 知:
dp = nv /dx, dpc= ( - 1) nv /dx
½
x, y 的变化为 0 , 因此由 ( 3) 得
dZ = P # nv /dx
( 4)
dZ c= N c# nv- P c# nv /dx

从而积分 Z dx 的变化为:Q
( dZ + dZ c)dx = (P # nv /dx + N c# nv- P c# nv /dx )dx = nv# (P + N cdx - P c)

¹ 事实上, 欧拉假定 Z 是 x、y、p = yc= dy /dx 以及其他更高阶微商 q, r, ,的一个函数, 其 中 qdx = dp, rdx = dq, ,
就是定义这些微商的关系式, 这里为了简单起见, 以只含一阶微商 p的情形进行说明。
º 实际上欧拉将此式写为:
Q
Zdx + Zdx + Zcdx + , , 这里为了清楚起见, 我们标上了积分的上、
下限。

» 欧拉将其称为 / 粒子 0 ( part icle) 。


¼ 这种表示偏微分的方式 在当时伯努利兄弟和欧拉的著作中是比较普 遍的 [ 14] , 英国数学家泰勒在其 5增 量方
法 6 ( 1715年 ) 中也有这种类似的表示方式 [ 15] , 其实这 种表示也 说明了 Z 对 变量的 依赖关 系, 即 Z = ( x, y,
p )。在 5技巧 6中, 这种表示为欧拉提供了一种表 示变化量的 方式。用现 在的记号 即为: dZ = Z x dx + Z y dy +
Z p dp。
½ 欧拉用一个表格给出了这些变化, 其中左边一栏是变量, 右边一栏是它们的增量。
316 自 然 科 学 史 研 究 28卷

这个表达式一定等于 0。欧拉令 P c- P = dP, 用 N 代替 N c, 从而得到 Ndx - dP = 0, 即


N - dP /dx = 0 ( 5)
¹ [ 16]
这就是已给极值曲线 az 所满足的基本微分方程 。
112 第二类问题基本方程的推导
在 5技巧 6第 3章的命题 Ó中, 欧拉转向了一类更复杂的问题, 这类问题在 5技巧 6中
占据着中心地位。

问题: 在所有平面曲线 y = y ( x )中, 寻求一条曲线, 使积分 Zdx (从 A 到 Z 积分 )取 Q


极值, 其中 Z 是 x, y, p = dy /dx 以及一个新变量 F的一个函数 º , F由条件 F = Q
[ Z ] dx 给

出, 其中 [ Z ] 是 x, y, p 的一个函数, 积分 Q
[ Z ] dx 表示 [ Z ] 从 A 到 M (其横坐标为 x ) 的积

分 » ( 图 1)。

对于这类问题, 欧拉的基本思路与第一类问题大致相同, 只不过他把计算积分 Zdx Q


的变化 ( 由 y c增 加 nv时所导致的 ) 的过程分成了以下两步 ( [ 11], 158) 160页 ):
第一步, 计算当纵坐标 yc增加 nv时, 导致 F, F c, F d, ,所发生的变化, 其中

F= Q
[ Z ] dx

F c= F + [ Z ] dx, ( 6)
F d= F + [ Z ] dx + [ Z c] dx,
F Ê= F + [ Z ] dx + [ Z c] dx + [ Z d] dx,
,,
这里的 F, F c, F d, F Ê, ,分别表示 [ Z ] 从 x = 0到 x = x, x = xc, x = x d, x = x Ê, ,的积分。
由于
d [ Z ] = [M ] dx + [N ] dy + [P ] dp
当 yc增加 nv时, y c, p, p c的变化分别为
dyc= nv, dp = nv /dx, dp c= - nv /dx
因而 [ Z ], [ Z c] , [ Z d] , ,的变化如下:
nv [P ]
d. [ Z ] dx = [ P ] # dx = nv# dx
dx dx
nv [ P c] ( 7)
d. [ Z c] dx = [N c] # nvdx - [ P c] # dx = nv# dx [N c] -
dx dx
d. [ Z d] dx = d. [ Z Ê] dx = , = 0
由 ( 6)、( 7)知 F, F c, F d, F Ê, ,的变化为:

¹ 这一方程现在通常称为欧拉方程或欧拉-拉格朗日方程, 是变分法的基本方程。
º 事实上, 欧拉假定了 Z 是 x, y, p = yc= dy /dx 以及其他更高阶 导数 q, r, ,和 F 的一个函 数, 其中 qdx = dp, rdx
= dq, ,就是定义这些高阶导数的关系式, 这里为了简单起见, 以只含一阶导数 p 的情形进行说明。

Q 1 + p dx 。
x
» 这一问题的提出主要源于这样一些例子, 其中 Z 依赖于 x, y, p 和弧长 s = 2
0
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 317

d. F = 0
[P ]
d. F c= nv# dx
dx ( 8)
[P ] [ P c] d [P ]
d. F d= nv# dx + nv# dx [N c] - = nv# dx [N c] -
dx dx dx
d. F d= d. F Ê = d. F = ,
( 4)

其中 d [ P ] = [ P c] - [ P ] 。

Q
第二步, 计算当 y c增 加 nv时, 积分 Zdx 所发生的总变化。欧拉将积分改写为

QZdx + Zdx + Z cdx + ,


M
¹
A

由于 dZ = M dx + Ndy + Pdp + LdF. , 如在第一类问题中那样, 由 y c, p, p c的变化所导致的积

Q
分 Zdx 的变化为:
dP
nv# dx N -( 9)
dx
当 yc增加 nv时, 所有的量 F, F c, F d, F Ê, ,都发生了变化, 由于这些量的变化而产生的

Q
积分 Z dx 的相应变化为:
Ldx # dF + Lcdx # d F c+ L ddx # dF d+ , ( 10)
将 ( 8)式给出的 dF, dF c, dF d, ,的值代入 ( 10)式得:
d [P ]
nv# dx (L c[ P ] ) + nv# dx [ N c] - (L ddx + L Êdx + L dx + , )
( 4)
( 11)
dx
欧拉用 L, [N ] 代替 L c, [N c], 并令 L ddx + L Êdx + L
( 4)
dx + , = H - Q
L dx , 其中 H 是 L 从 A

QLdx , QL dx = Q
a x

到 Z 的积分 (即 H = 0
Ldx ), 将其代入 ( 11)得:
0

nv# dx (H - Q Ldx ) [N ] - d [ P ] + nv# dx (L [ P ] ) ( 12)


dx

Q
由于 d ( L dx ) = Ldx , 所以 ( 12) 就可写为:

Q
d ( [ P ] (H - Ldx ) )
Q
nv# dx ( 13)
[N ] (H - Ldx ) -
dx

Q
将 ( 13)和 ( 9)式相加, 即得积分 Z dx 的总变化, 令此表达式等于 0, 由此他得到了该问题
的基本方程:

Q
d ( [P ] (H - Ldx ) )
Q
dP
[N ] (H - Ldx ) - +N - = 0º ( 14)
dx dx

¹
Q
欧拉将此式写为 Zdx + Zdx + Zcdx + , , 为了清楚起见, 我们标上了上、下积分限。
º 在现代变分法中, 方程 ( 14) 由拉格朗日乘子法则推导而得, 并且是如下问题的基本方程: 寻求函数 y = y ( x ),

QZdx 取极值, 并且满足条 件: d F /dx - [ Z ] = 0。这个 问题 可转 化为被 积函 数 Z + K ( d F /dx -


a
使得积分
0

[ Z ] )的无条件积分极值问题, 其中 K称为乘子 ( mu lt ipl ier) 。


318 自 然 科 学 史 研 究 28卷

2 拉格朗日的纯分析方法

拉格朗日在 1755年 8月的信中, 首先简单地描述了他所发现的新方法, 接着用此方


法讨论并解答了 5技巧 6中的一些基本问题。他的方法是在当时的微积分学中引进符号 D
及其演算。他用符号 D表示另一种形式的微分, D不仅可以作用在诸如 F ( y ) 这样的函数

Q
上, 还可以作用在积分 Zdx 上。他假定 x 关于 D是恒定不变的, 即 Dx = 0; Dy 表示在这种

极大或极小问题中, 纵坐标 y 的变化, 但不同于通常的微分 dy; 量 D F ( y )表示当 y 增加 Dy


时, F ( y )的增量 (F 是 y 的一个函数 ) 。他断言如下交换法则成立:
dDF (y ) = DdF ( y ) ( 15-a)
一般地
Dd F (y ) = d DF ( y )
m m
( 15-b)
特殊地
dDy = Ddy ( 15-c)

Q Q
DZ =
DZ ( 16)

接下来拉格朗日列出了如下一些关系式, 而这些关系式均可由分部积分法得到:

Q
zdu = zu - Q
udz ( 17)

Q
zd u = zdu - udz + Q
2
ud z
2
( 18)

Q
zd u = zd u - dzdu + ud z - Q
3 2 2 3
ud z ( 19)

Q
uQz = Q u @ Qz- QzQ u ( 20)

Q Q
他令 u = H, H - u = V , 从而 ( 20) 为:

Q
uQ
z = Q
Vz ( 21)

积分 ( 17) 、( 18) 、( 19) 均是从 x 的初始值 (不妨设为 x = 0)到末值 (不妨设为 x = a ) 进行

Q
积分; 在关系式 H - u = V 中, H 是 u 从这个初始值到 x = a的积分, 而 Q
u 是 u 从这个初

值到 x = N( 0< N< a )的积分, 因而 ( 20) 、( 21) 用现在的记号写出来就是:


N N

Q Q Q Q Q Q
a a a a

0
u ( N) dN0 z ( x ) dx = 0
u ( x ) dx @ 0
z (x ) dx - 0
z( N) dN 0 u ( x ) dx, ( 20c)
N

Qud N Q
zdx = Q
a a

0
Vzdx
0 0
( 21c)

给出上述规则和关系式之后, 拉格朗日接着考察了 5技巧 6中的基本问题。


211 第一类问题基本方程的推导
拉格朗日设 Z 是 x, dx, y, dy, d y, ,的函数, 于是被积函数 Z 的微分为:
2
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 319

dZ = M dx + Ndy + Pd y + Qd y + Rd y + ,
2 3 4
( 22)
据此他写出
DZ = N Dy + P Ddy + Q Dd y + R Dd y + ,
2 3
( 23)
由 ( 16), 并且积分 ( 23) ( 不妨设积分区间为 [ 0, a ] ) 得:

Q Q Q
D Z = N Dy + P Ddy + Q Dd y + , Q
2
( 24)

由 ( 15-a) 、( 15-b) 、( 15- c) , 交换 d 和 D的次序, 运用公式 ( 17) 、( 18)、( 19)得:

Q Q Q
D Z = N Dy + P Dy - dP Dy + QdDy - dQDy + d Q Dy - , Q 2
( 25)

因而

Q Q
DZ =
(N - dP + d Q - , ) Dy + (P - dQ + , ) Dy + (Q - , ) dDy + ,
2
( 26)
2
拉格朗日假定: 当 x = a 时, 有 Dy = dDy = d Dy = , = 0, 同时他还隐含地认为这些量在 x = 0
处也等于 0。因而 ( 26)就变为

DZ =Q Q
(N - dP + d Q - , ) Dy
2
( 27)

此时拉格朗日断言由 / 通常的极大或极小方法 0就可得到:


N - dP + d Q - , = 0
2
( 28)
如果 Z 只是 x, dx, y, dy 的函数, ( 28)就变为
N - dP = 0 ( 29)
这就是前面介绍的第一个问题的基本方程。
212 第二类问题基本方程的推导

设 Z 是 x, dx, y, dy, d y, ,和一个附加变量 P的函数, 而 P由边条件 P=


2
Q
(Z ) ( 从

x = 0到 x = x 的积分 )给出, 其中 (Z )是 x, dx, y, dy, d y, ,的一个函数, 由于


2

dZ = LdP+ Mdx + Ndy + Pd y + Qd y + ,


2 3

( 30)
d (Z ) = (M ) dx + (N ) dy + (P )d y + (Q )d y + ,
2 3

拉格朗日据此写出:
DZ = L DP+ N Dy + P Ddy + QDd y + ,
2

2
D( Z ) = (N ) Dy + (P ) Ddy + (Q ) Dd y + , ( 31)
DP = Q
(N ) Dy + Q
P Ddy + , ¹

因而

Q Q Q Q QQ
D Z = N Dy + PdDy + Qd Dy + , + L (N ) Dy + L (P ) dDy + , QQ
2
( 32)

Q
令 H 为 L 从 x = 0到 x = a的积分, 他记 H - L = V, 其中 L 为 L 从 x = 0到 x 积分。运用 Q
( 21) 变换 ( 32) 得:

¹ 此式中的各项积分为从 x = 0到 x= x 的积分。
320 自 然 科 学 史 研 究 28卷

Q Q
DZ =[N + (N ) V ] Dy + Q
[ P + (P )V ] d Dy + Q
[ Q + (Q ) V ] d Dy + ,
2
( 33)

拉格朗日按照从 ( 24)推 ( 27) 相同的步骤由 ( 33)推出如下方程:


N + (N ) V - d [ P + (P ) V ] + d [ Q + (Q ) V ] - , = 0¹
2
( 34)
如果 Z 和 (Z )中不含高于一阶的微分, ( 34)就变为:
N + (N ) V - d [ P + (P )V ] = 0 ( 35)
这就是前面介绍的欧拉第二个问题的基本方程。
这里需要说明的一点是, 在 5技巧 6中, 将 Z 看成是 x, y, p, ,的函数 ( 其 中 p = dy /
dx ) , 而拉格朗日在信中, 将 Z 看作是 x, dx, y, dy, d y, ,的函数。欧拉改变 p 的地方, 拉格
2

朗日改变 dy。按照 18世纪莱布尼茨形式微积分的演算程序, 如果 y 是 x 的某个函数, 那


么在所有的计算中, dx 将保持恒定不变。因而当拉格朗日说 x 关于 D恒定不变 (即 Dx =
0)时, 其实意味着 dx 是常数, 若将此常数看作单位 1, 则拉格朗日的结果 ( 29)和 ( 35) 与欧
拉的结果 ( 5) 和 ( 14) 完全一致。

3 拉格朗日对欧拉方法的形式化改造

311 欧拉和拉格朗日方法的比较
基于前面的考察, 我们发现欧拉方法和拉格朗日方法之间存在着很大差别, 主要表现
在以下几方面:
( 1) 欧拉的方法依赖于几何直观, 其出发点和推导过程中的每一步都烙有几何的印
迹, 具有明显的几何解释; 而拉格朗日的方法是纯分析的, 他通过引进符号 D及其运算规
则, 摆脱了对几何直观的依赖, 使得整个推导过程变成了一种形式的、/ 遵照一致而正规
的程序的代数 [分析 ] 运算 0( [ 10] , 373页 ) 。
( 2) 欧拉只要求极值曲线上一点处的纵坐标发生改变, 以期获得比较曲线; 而拉格朗
日则通过 D的形式演算实现了极值曲线上所有纵坐标的同时改变, 即实现了整条曲线的
变分, 从而开创了一般意义上的变分。
( 3) 欧拉的方法较为繁复, 特别是当考察被积函数中含有高阶微商的情形时尤为如
此, 同时还包含了粗糙的极限过程 [如在推导 ( 5) 时, 用 N 代替 N c; 从 ( 11) 推导 ( 12)时, 用

Q
x
L, [N ] 分别代替 L c, [N c], 用 H - Ldx 代替 L ddx + L Êdx + L dx + , 等 ]; 而拉格朗日的
( 4)
A

方法是在一些运算规则基础上所进行的公式推演, 显得简捷、
优美、
更具一般性, 同时为诸
如处理变动端点等问题提供了方便 º , 因而是对欧拉方法的极大改进和推广。
( 4) 如果从现代的观点看, 欧拉的方法蕴含着把变分问题化为普通函数极值问题的
思想, 从而把变分问题与熟知的普通函数极值问题联系了起来; 而拉格朗日的方法孕育着
将普通函数极值理论籍以建立的概念 ) ) ) 微分, 推广到更广泛意义的函数 ) ) ) 泛函上去

¹ 在现代变分法中, 从 ( 27) 到 ( 28) 、( 33 ) 到 ( 34) 是在一阶 变分等于 零这一必 要条件的 基础上, 依 变分法基 本
引理得到。
º 从 ( 26 )式就可看出这一点。
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 321

的思想, 从而使变分法的发展走上了一条与传统不同的路线。
当然, 拉格朗日的方法还有许多不成熟的方面: 如没有对 D的含义进行严格阐述; 未
对运算法则 ( 15-a) 、( 15-b)、( 15- c)、( 16 ) 提供 证明; 没 有给出从 ( 27) 到 ( 28)、( 33 ) 到
( 34) 的合理解释等等。但瑕不掩瑜, 从上面的比较可以看出, 变分法从欧拉到拉格朗日
的过渡, 包含和体现了重大的革新和发展。
312 拉格朗日的形式化改造
为什么会提出 D
现在来分析拉格朗日为什么要变革欧拉的方法、 -算法以及他是如何
获得这一算法的。在信中, 拉格朗日声称他之所以从事这项研究, 主要受 5技巧 6第 2章
39段中所作评论的启发和激励。欧拉的评论为:
因而需要一种方法, 这种方法不受几何的约束, 而且运用这种方法时, 显然在这
种极大或极小问题的研究中, 应该最终将 Pdp 用 - pdP 来代替。 ( [ 1] , 56页 )
其含义就是: 如果 dZ = M dx + Ndy + Pdp, 令 Mdx = 0, Ndy 不变, 将 Pdp 写成 - pdP, 那么方

Q
程 Ndy - pdP = 0就是使积分 Z dx 取极值的曲线所应满足的方程。

毫无疑问, 这段话中所含的挑战的确给拉格朗日留下了深刻的印象, 并且为拉格朗日


的研究树立了目标、
明确了方向。然而仅凭这段话并不足以全面解释拉格朗日是如何得
到他的新方法的。如果我们对欧拉和拉格朗日各自的推导过程进行仔细地考究和分析,
就能发现一些非常重要的线索, 循着这些线索, 我们可以窥视到拉格朗日改造欧拉方法的
真实情景。
欧拉在推导变分问题基本方程的过 程中, 在符号的使用方面 存在一个明显的缺陷
(至少在当时看来 ) , 这就是符号 d 的双重含义和混用。一方面, d 用来表示当时传统意义
上的微分, 即微分 dx 保持恒定不变, 任何其他量的微分就等于这个量在 x 和 x + dx 两点
的值之差, 这种演算方法在 18世纪初期莱布尼茨形式的分析学中经常使用, 并且在当时
[ 17]
广为接受和采用 。
另一方面 d 也用来表示当纵坐标 y 发生变化时, y 自身以及导致其他量的变化, 为了
简便起见, 我们不妨将这种意义下的 d 称为新型 / 微分 0。欧拉在推导第一类变分问题基
本方程时, 在 ( 5)及其获得 ( 5)的最后一步中, 他用 d 来表示传统意义下的微分。而对于
( 3)式, 欧拉在书写这个表达式时, 其中的 d 也表示传统意义下的微分, 但是当他转而考
虑由纵坐标 y c增 加 nv所导致的其他量的变化时, 符号 d 的含义发生了变化, 他将 ( 3)中出
现的微分 dZ、dZ c、dx、dy、dp、dy c、dp c看 成是量 Z、Z c、x, y, p, yc, p c的变化, 而这种变化是当
纵坐标 yc增加 nv时所产生的, 因而此时 d 就表示这种新型 / 微分 0, 从而 / 微分 0dy c, dp,
dp c分别等于 nv, nv /dx, - nv /dx, 而 / 微分 0dx, dy 等均为 0, 并有 ( 4)成立, 且 ( 4)中 dZ、dZ c
表示这种新型 / 微分 0, 而 dx 则表示传统意义下自变量的微分。
同样, 在欧拉推导第二类变分问题的基本方程 ( 14) 的过程中, 我们也能看出符号 d
的这种双重含义和混用: 在计算由 y c增 加 nv 所导致的 [ Z ]和 s 的变化时, 用符号 d 表示
这种新型 / 微分 0, 如 ( 7)中的 d. [ Z ]、d. [ Z c] 、d. [ Z d] 等和 ( 8)中的 d. F、d. F c、d. F d等;
而在诸如 ( 14)这样的方程中, 用符号 d 表示那种传统意义下的微分。事实上, 欧拉在这
一问题中已对符号 d 的双重用法有所体察, 因此他令
322 自 然 科 学 史 研 究 28卷

d [ Z ] = [M ] dx + [N ] dy + [ P ] dp,
而将由 yc增加 nv时所导致的 [ Z ] 的变化记为 d. [ Z ] , 然而他在考虑方程 ( 8) 和 ( 10) 时,
并没有做到前后一致。
那么, 拉格朗日在研究 5技巧 6一书的过程中, 是否注意到欧拉在符号 d 的运用上的
这种缺陷呢? 笔者认为答案是肯定的。因为拉格朗日在信的开始部分就很明确地表示:
他引进记号 D是为了 / 区分另一种形式的变化 0 ( [ 4] , 140页 ) , 并且在其 1760年的第一
[ 18]
篇关于变分法的论文中 , 他这样写道:
, ,由于这种方法 ¹ 要求同样的量以两种不同的方式变化, 为了不致引起混淆,
我在计算中引进了一种新的标记 D
, 这样, DZ 表示 Z 的差, 这种差不同于 dZ ,,
[ 19 ]

这说明他一定注意到了欧拉在符号 d 的使用上的这种双重含义和混用现象, 由此萌发了


用一个新符号 D来表示另一类型的 / 微分 0的想法。
笔者认为这种想法正是拉格朗日改进欧拉方法的切入点, 以此为突破口, 拉格朗日通
过符号处理和形式化的代数推演, 发明了 D-算法, 从而完成了摆脱几何直观和简化计算的
目标。
如果细致地探究拉格朗日的推导过程, 我们会发现他这种形式化改造的一些明显痕
迹。如他对 Dx = 0的规定、
根据 ( 22)写出 ( 23)、根据 ( 30) 写出 ( 31) 。又如他对交换法则
[ 20]
( 15-a)、( 15-b)、( 15-c)、( 16)等没有给出证明, 而只是提到了欧拉 1734年的论文 。事
实上, 欧拉在这篇论文中得到的是如下结果: 设 z 是 a 和 x 的函数, 如果先将 a 固定, 对 z
微分得 Pdx, 然后让 x 固定, 微分 Pdx 得 Bdxda; 接着他又将 x 固定, 微分 z 得 Qda, 再让 a
固定, 微分 Qda 得 Cdadx, 则 B = C。º
为了证明这个结果, 欧拉首先考察了三个量:
e= z (x + dx, a ), f = z ( x, a + da ), g = z( x + dx, a + da )
接着就断言:
Pdx = e- z, Bdxda = ( g - f ) - ( e- z )
( g - f 是在 e- z 中将 a用 a+ da 代换而得到的 ) ; 类似地,
Qda = f - z, Cdadx = ( g - e) - ( f - z )
因而 B = C。由此我们不难看出拉格朗日将符号 D与 d 及其运算规则进行类比的这种鲜
明的形式化处理手法。再如, 从 ( 27)到 ( 28) 的推导过程, 拉格朗日声称由 / 通常的极大或
极小方法 0就可以由 ( 27) 推得 ( 28) , 而通常的普通函数的极大或极小方法就是将极值问
题归结为 df = 0( 其中 f 是一元或多元函数 ), 如果与此进行类比 » , 就可得到

Q Q
DZ =DZ = Q
(N - dP + d Q - , ) Dy =
2
0

进而得到 ( 28) , 这里我们也可感受到拉格朗日的这种形式类比的手法。另外, 拉格朗日


在 1755年 11月 20日写给欧拉的一封信中, 解释了他之所以在被积函数中用 dy 而不用

¹ 这里指拉格朗日发明的新方法 ) ) ) 变分方法。
52 z 52 z
º 这就是二元函数混合偏导数相等定理, 用现代的记号就是 = 。
5a5x 5x5a
» 我们并不否认欧拉相应结果对拉格朗日的指引。
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 323

[ 21]
p, 主要是基于一种更为灵活的代数演算 , 这从一定意义上也说明了他形式化改造的真
实一面。
由此可见, 拉格朗日在引进符号 D之后, 将 D与通常微分符号 d 的运算规则进行了类
比, 并在欧拉相关步骤和结果的指引下, 用形式和代数的方法进行改造, 反复试验, 提炼有
关 D的运算法则, 在此基础上最终发明了 D
-算法。因而从这种意义上来说, 拉格朗日对变
分法所作的变革, 是形式化改造的产物。

4 结 语

5技巧 6的出版, 标志着变分法作为一门数学分支的初步确立, 拉格朗日 D-算法的提


出, 开辟了变分法发展的新时代。从欧拉方法过渡到拉格朗日方法, 蕴含着变分法重大的
革新。拉格朗日以摆脱几何直观和简化计算为目标, 以消除欧拉方法中微分符号 d 的双
重意义和混用现象为切入点, 通过引进符号 D, 借助于形式的处理和反复的演算, 发明了
D-算法。因此, 拉格朗日 D
-算法的提出, 是形式化改造的产物。
拉格朗日用形式化的手法对欧拉方法所作的成功改造, 将变分法的发展推进到一个
崭新的阶段, 显示了在技术和形式上的某种革新也会导致数学的重大发展, 这对他本人和
欧拉后来的科学研究产生了深刻的影响, 愈使他们领悟到由形式化所引发的纯分析方法
一般性, 进而对 18世纪微积分学从几何形态向 / 代数分析 0形态的过渡、几何
的优越性、
论证向分析论证的转变起到了不可忽视的推动作用。
著名数学史家克莱因 ( M orris K lin e, 1908) 1992年 ) 曾指出 18世纪的数学家 / 对符号
的信任远远超过对逻辑的信任 0 ( [ 10] , 377页 )。拉格朗日对变分法所作的这种形式化
改造, 一方面充分体现了符号化的价值以及他对符号的信任, 另一方面由于变分问题在
17世纪末和 18世纪初是检验微积分学新方法的试金石, 而欧拉和拉格朗日都是 18世纪
数学界的领军人物, 他们对变分法的研究, 为他们各自在早年赢得了极高的荣誉 ¹ , 因此
对变分法所作的这种形式化改造的成功, 无疑助长了当时数学家对符号的信任程度。
数学史家格拉比勒 ( Judith V. G rabiner)认为, / 18世纪对符号的信任, 在整个数学史
上有点反常, 对此有必要作进一步的解释。0
[ 22]
因而对变分法历史中的上述问题进行探
究, 或许会对全面理解和认识 18世纪数学的特点和发展提供一个新的视角。

本文是在博士论文 519世纪以前的变分法 6
[ 23]
致 谢 的第四章第三节和第六章第
1节的基础上修改而成, 其主体内容曾在第二届全国数学史与数学教育研讨会暨第七届
全国数学史会议上进行过宣读。本文在写作过程中, 承蒙导师曲安京教授的悉心指导, 徐
传胜博士也提出了一些非常中肯的建议, 在此一并表示诚挚的谢意!

¹ 5技巧 6的出版为欧拉带来了极大的荣誉, 他被 认为是当 时活着的 最伟大的 数学家; 而 拉格朗日 对欧拉方 法


的成功改造, 是他一生中的第一项重大数学成果, 立即使他在数学界名 声大噪, 19 岁就被 任命为意大利都 灵
( Turin ) 皇家炮兵学校的数学教授。
324 自 然 科 学 史 研 究 28卷

参 考 文 献
1 E ulerL. M ethodus Inven iend i Curvas L ineasM axim iM in im ive ProprietateG aud entes sive S olut ion P rob lem atis Isoperim etr-
i
ci Lat iss im o Sensu A ccept i[ A ] . C arath†odory C ( ed s) . L eonhard i Eu leri O pera Om nia [ C ] . Ser. I, V o.l 24. Zu rich:
O rell Fu ss l,i 1952.
2 C arath†odory C. Th e B eginn ing of R esearch in th e C alcu lu s of V ariat ion s [ J] . O risis, 1937, 3: 224) 240.
3 G oldstineH H. A H istory of th e Ca lculus of Va ria tion s from the 17 th through th e 19 th Century [ M ] . B erl in \ N ew Y ork :
Springer-V erlag, 1980.
4 Lagrange J L. Letter to Eu ler 12 A ugust 1755 [ A ] . S erret J A ( eds) . O euvres de L agrange [ C ]. V o.l X IV. Paris: G au th-
ier-V illars, 1892. 138) 144.
5 E uler L. Letter to Lagrange 6 S eptem ber 1755[ A ] . Juskevic A P, Taton R ( eds) . L eonhard i Eu leri O pera Omn ia [ C ] .
Ser. IVA, V o.l 5. Base:l B irkh¾user, 1980. 375) 378.
6 E uler L. E lem enta C alcu li V ariat ionum [ A ] . C arath†odory C ( eds) . L eonhard i Eu leri O pera Omn ia [ C ] . Ser. I, V o.l 25.
Zu rich: O rell Fuss l,i 1952. 141) 176.
7 Eu ler L. A n alytica Exp licat ioM ax im orum et M in im orum [ A ]. Carath†odory C ( ed s) . L eonhardi Eu leri O pera Omn ia [ C ] .
Ser. I, V o.l 25. Zu rich: O rell Fu ss l,i 1952. 177) 207.
8 曲安京. 中国数学史研究范式的转换 [ J] . 中国科技史杂志, 2005, 26( 1 ) : 50) 58.
9 W oodhouse R. A Treatise on Isoperim e trical P roblem s and the C alcu lu s of Varia tions [ M ] . Cam b ridge U. K. : Cam bridge
U n iversity P ress, 1810.
10 ( 美 )克莱因 M . 古今数学思想 [ M ] . 第 2 册. 朱学贤, 申又棖, 叶其孝, 等译. 上海: 上海科学技术出版社, 2002.
11 F raser C G. J. L. Lagrangeps Ch anging A pproach to the Foundat ion s of the C alcu lu s of V ariations [ J] . Arch iv e f or H istory
of Exact S ciences, 1985, 32: 151) 191.
12 张洪光. 欧拉 [ A ] . 吴文俊. 世界著名数学家传记 [ M ] . 上册. 北京: 科学出版社, 1995. 678) 679.
13 易照华. 拉格朗日 [ A ] . 吴文俊. 世界著名数学家传记 [ M ] . 上册. 北京: 科学出版社, 1995. 705) 706.
14 Engelsm an S B. Fam il ies of Cu rves and th e O rigins of Partial D iff erentiation [ M ] . Am s terdam: N orth-H olland, 1984.
15 Fe igenbaum L. Brook Taylor and theM ethod of In crem en ts[ J] . Archive forH istory of Exact Sciences, 1985, 34: 1) 140.
16 Stru ik D J. A Sou rce Book in M a thema tics, 1200) 1800 [ M ]. H arvard: H arvard U n iversity P ress, 1969. 403) 404.
17 Bos H J M. D ifferen tials, H igh-order D if feren tials and the D erivat ive in the Leibn izian C alculus[ J]. Arch ive f orH istory of
E xa ct Sciences, 1974, 14: 1) 90
18 Lagrange J L. E ssa i dpun eN ouvelleM ethode pour D eterm iner lesM ax im a et lesM in im a des Formu las Ind ef in ies[ A ] . S er-
ret J A ( eds) . O euv res de L ag rang e[ C ] . V o.l I. Paris: G auth ier-V illars, 1867. 335) 362.
19 李文林. 数学珍宝 ) ) ) 历史文献精选 [ M ] . 北京: 科学出版社, 1998. 357.
20 Eu ler L. D e In fin itis Curvis E iusd em G enes is seu M ethodu s Inven iend i A equationes pro Inf in itis C urv is E iu sdem G eneris
[ A ] . D u lac H ( ed s). L eonhard i E uleri O pera Omn ia [ C ] . Ser. I, V o.l 22. Le ipzig-B erl in : Teubner, 1936. 36) 56.
21 Lagrange J L. L etter to E u ler 20 N ovember 1755[ A ]. Serret J A ( eds) . O euvres de L ag range [ C ] . V o.l X IV, Paris:
G au th ier-V illars, 1892. 146) 151.
22 G rab iner J V. Is M athem atical T ruth T im e-dependen t? [ J] . Am erican M a thema tica l M onthly, 1974, 81: 354) 365.
23 贾小勇. 19世纪以前的变分法 [ D ] . 西安: 西北大学, 2008.
3期 贾小勇等: 变分法 的一次变革: 从欧拉到拉格朗日的形式化改造 325

The Calcu lus of Variation s from Eu ler to Lagrange:


A s a R esu lt of Form alized Imp rovem ent

JIA X iaoyong,
( School ofM a thema tics and S ta tistics, Chongqing Un iv ersity of A rts and S ciences, Yongchuan 402160, Ch ina )
LI Y uewu
(M ath em atics D epartm ent, H ezuo M inorities Teachers Colleg e, H ezuo 747000, C hina)

Abstract T he calcu lus o f variations w as estab lished as a d istin ct b ranch of analysis w ith th e
pub lication in 1744 of Eu lerpsM ethodu s inveniend i cu rva s linea s max im i m in im ive prop rietate gaud en-
tes sive solu tion problem atis isoperim etrici la tissimo sen su a ccepti. The inven tion in 1755 of the D-algo-
rithm of L agrange u shered in a new epoch in th e calcu lu s of variations. From Eu ler to L agrange th e
sub ject h ad gon e through great innovat ions. Based on som e orig inal literatu re and the detailed com-
p arison and analys is b etw een m ethods of Eu ler and L agrange, the background and genesis and in flu-
ence of Lagrangeps algorithm are con sidered and exp lored in th is paper. F in ally, th e paper concludes
that Lagrangeps m
i provem en t in the ca lcu lus of variat ions is essen tially th e resu lt of form alization, and
th
that th e success of the form al m
i p rovem en t p roduced great effects on the developm ent of the 18 ca-
l
cu lu s, and to som e ex tent re in forced the tru st o fm athem aticians in mathematical symbo.l
K ey words the calcu lus of variations, L. Eu ler, J. L. Lagrange, form alization

You might also like