24. 常微分方程解的存在唯一性, Kepler 三大定律的证明, 变分法

常微分方程解的存在唯一性定理

回忆一下, 在第七次课中, 我们证明如下压缩映像定理:

是完备的距离空间. 假设映射 是压缩映射, 即存在常数 , 使得对任意的 , 我们都有那么, 必有唯一的不动点, 即存在唯一的 , 使得 .

不动点定理与微积分基本定理结合, 可以证明常微分方程解的存在唯一性定理:

定理 24.1 (Cauchy–Lipschitz). 给定完备的赋范线性空间 (通常我们假设 ) , 是开集, 是开区间, 是给定的连续函数 (映射) . 假设存在 , 对任意的 , 映射-Lipschitz 映射, 即对任意的 , 有如下估计那么, 对任意的 (初始值) , 存在 (可能依赖于 ) , 存在唯一的映射 , 满足如下的常微分方程:

假设我们想解常微分方程 (以 为例子) 这个定理讲的是对任意给定的初值 , 即要求 , 总能存在比较小的的一个时间窗口 , 使得我们能找到唯一一个函数满足方程和初值条件. 换句话说, 这样的常微分方程系统局部上总是有解的, 当然, 我们必须要求 有比较好的光滑性假设 (Lipschitz) .

注记. 定理 Lipschitz 的假设是重要的:

1)

如果只假设 对于 变量是连续的, 即不进一步要求 Lipschitz 条件 成立, 那么定理的结论并不成立. 实际上, 我们仍然可以证明上面的常微分方程系统局部上有解 (Peano 定理) , 但是解可能并不唯一.

2)

在应用这个定理的时候, 通常都是非常光滑的函数, 比如说对任意的 , 映射 的 () . 我们进一步假设 (这个条件在应用的时候一般也都成立) 函数 是连续映射. 所以, 通过适当地缩小 , 就存在 , 使得根据 Lagrange 中值定理, 我们有此时, 定理的条件是成立的.

证明. 我们首先利用 Newton–Leibniz 公式将问题转化为一个积分方程的问题. 假设 是方程的解, 这个解自然是连续的. 根据 Newton–Leibniz 公式, 我们必然有如果我们将 视为某个空间中的点, 那么上面的积分等式可以被理解为一个不动点的表达式. 我们可以精确地描述这个问题: 令 , 这是一个完备的距离空间, 其中 待定. 我们定义 到自身的映射: 所以, 积分形式的问题可以表述为为了证明不动点的存在性, 我们需要验证压缩映像的条件: 对任意的 , 对给定的 , 我们有由于这对任意的 都成立, 所以只要 , 我们就有 , 根据不动点定理, 存在唯一的 , 满足很明显, . 由于 , 所以右边的积分项定义的函数是连续可微的, 从而 连续可微. 通过求微分, 我们得到命题得到了证明.

在应用的时候, 我们经常会遇到二阶的微分方程这样的系统可以约化为一阶的系统: 定义 , 那么, 上述方程就变成了从而, 仍然局部有解. 当然, 为了解这个方程, 我们需要一开始给定两个初始值. 比如说, 考虑方程如果初始值给的是 , , 那么就唯一地锁定了 作为上述方程的解; 如果初始值给的是 , , 那么就得到 作为上述方程的解. 上面从二阶方程到一阶方程的转变过程也体现了向量值函数的微积分理论的威力.

练习. 你是否能写出下面方程的解:

行星运动的 Kepler 定律: Newton 的数学推导

我们中学学习过经典力学中 Newton 的三个运动定律:

1)

任何物体都保持静止或匀速直线运动的状态, 直到受到其它物体的作用力迫使它改变这种状态为止.

2)

物体在受到合外力的作用会产生加速度, 加速度的方向和合外力的方向相同, 加速度的大小正比于合外力的大小, 与物体的惯性质量成反比.

3)

两个物体之间的作用力和反作用力, 在同一条直线上, 大小相等, 方向相反.

我们再回忆 Newton 的万有引力定律:

给定两个质点, 它们之间引力的大小正比于每个质点的质量, 反比于质点距离的平方: 其中 是两个质点的质量, 是它们之间的距离. 其中, 根据标准的单位制, .

对于太阳系中行星的运动, 我们可以做如下理想的数学假设:

1)

把太阳和行星都想象成质点, 这因为星球本身的半径和运动轨道的尺度相比较可以忽略;

2)

假设行星之间并没有相互引力, 这因为太阳的质量大概占了太阳系质量的 99.8% 以上, 其它行星的质量贡献太小可以忽略不计.

行星运动的空间我们用 来描述, 通过选取坐标系, 可以假设太阳 (质量 ) 在原点 处. 假设在时刻 时, 行星 (质量 ) 所处的位置是 , 所谓行星运动的刻画就是描述映射 , 比如说, 知道 2019 年 12 月 9 日早上 9:50 数学分析课开始的时候地球在太阳系的位置 和速度 , 我们要知道 1750000000 年后地球的位置 (据说地球上的生物还有机会生活至少 17.5 亿年) .

根据 Newton 第二定律 (速度的导数是加速度) , 我们有其中 是行星到太阳的距离, 是它受力的方向. 所以说, 行星的运动轨迹 满足如下的常微分方程: 我们注意到上面的方程和行星本身的质量 没有关系, 只和太阳的质量 有关!

这个问题本身很明显是不依赖于坐标系的选择的, 我们为了方便才引入的坐标系. 所以, 通过适当的选取坐标系统, 我们假设在开始的时刻 都落在坐标平面 上, 即 的第三个坐标是零.

我们来观察运动方程 中第三个坐标 满足的方程: 我们可以将 看做是已经给定的函数 (如果有解的话) 并且假设 (如果 的话行星就撞上太阳了! ) . 那么, 是上述方程的一个解. 根据常微分方程的解的存在唯一性, 我们知道所以, 如果初始时刻行星的位置和速度处于一个平面, 那么自始至终, 行星都在这个平面上运动. 根据这些推导, 我们可以假设行星只做平面运动, 即 .

注记. 上面的论证可以在物理上用角动量守恒来证明, 我们走了捷径. 下面的推导可以通过能量守恒来考虑 (在常微分方程的理论中, 这被称作是首次积分) , 为了篇幅和时间的考虑, 我们不再追究背后的这些深层次的原因.

用平面上的极坐标系改写 Newton 的运动方程 ( 用复数的形式表达) , 那么 也是可微的 (为什么) . 此时, 我们有代入方程, 比较系数就得到第一个方程等价于 , 所以, 存在常数 , 使得如果一开始 , 那么只能是 , 即 恒为常数, 所以行星做直线运动, 这样它或者远离太阳或者冲向太阳, 我们不关心这种情况.

我们假设 (通过对换 轴和 轴, 我们总可以假设行星逆时针运动) . 特别地, 局部上是 的增函数, 所以局部上我们可以考虑 的逆映射, 也就是说我们认为 (至少在局部上) 是 的函数. 再定义函数 . 转换一下视角: 我们现在用 作为变量, 来描述 的运动.

按照定义, 第一个方程可以写成根据链式法则, 我们有所以, 我们有代入第二个方程, 我们得到其中 代表对 求导数. 经过整理, 我们得到这个方程的解不容易一下子猜出来. 但是我们观察到, 如果右边没有常数 , 解这个方程就是在解关于 的方程. 从而, 我们知道方程的解一定形如这里 都是待定的常数.

我们选取行星近地点 (即离着太阳最近的时候) 作为初始时刻: 数学上来说, 就是 时, 最大, 所以代入 的待定表达式, 我们得到从而, 我们得到这是圆锥曲线方程在极坐标下的表达. 令 , , 方程变化为其中 是圆锥曲线的离心率. 按照离心率的大小, 我们有如下的分类:

. 此时, 行星的运动轨迹恰好是一个圆, 半径为 .

. 此时, 行星的运动轨迹恰好是一个椭圆. 我们回忆一下, 椭圆的半短轴 和半长轴 的比例为 , 那么 .

. 此时, 行星的运动轨迹恰好是一个抛物线.

. 此时, 行星的运动轨迹恰好是一个双曲线的一支.

我们回忆一下, Kepler 通过研究前人的观测数据, 发现和总结了关于行星运动的三个定律:

(1)

每个行星都沿各自的椭圆轨道环绕太阳运行, 太阳处在椭圆的一个焦点上.

(2)

在相等时间内, 太阳和运动着的行星的连线所扫过的面积都是相等的.

(3)

行星绕太阳公转周期的平方和它们的椭圆轨道的半长轴的立方成正比.

至此, 我们已经严格从数学上论证了 Kepler 的第一定律!

我们现在证明 Kepler 的第二定律, 这等价于说面积的变化率是常数. 当然, 迄今为止, 我们并未定义面积 (严格的定义和二重积分密切相关) . 我们给出不严格的论证: 在上面的计算中, 我们已经证明 , 这就是面积的变化率的两倍, 因为当 变为 时, 变为 , 而面积的变化大约为 , 请参见下图的灰色三角形:

MathAnalysis N25P1.svg

Kepler 第三定律给出了行星运动的周期, 它实际上是第二定律的推论. 我们首先计算椭圆的面积:

练习. 给定 上由方程 定义的椭圆, 它的面积为 . 实际上, 我们可以用积分来定义这个叙述:

于是, 周期 (因为 是面积的变化率的两倍) . 通过之前对各个参数的计算, 我们立即得到这就是第三定律. 我们特别强调, 上面的表达式中 是太阳的质量.

跑题: 太阳质量的测量

根据 Kepler 第三定律的公式, 太阳的质量可以用 来计算. 在这个公式中, 是已知的参数. 由于我们绕太阳转一周就是一年, 所以 也已经知道. 参数 (几乎) 是地球到太阳的距离, 所以如果能测量日地距离 (需要一把稍长的尺子) , 我们就能称太阳的重量! 关于日地距离的计算, 我们用金星凌日法. 所谓的金星凌日就是太阳, 地球和金星这三个点在一条直线上的天文现象 (我国古人称之为太白犯主: 太白主兵, 与日合, 大不详) , 历史上有记载的玄武门之变之前有金星凌日! 1677 年, Halley 预测了 1761 年会发生的金星凌日, 他认为通过在地球上若干个地点的观测再加上对金星运动周期的观测数据, 就可能算出太阳的距离. 他晚年的时候又提出了利用金星凌日计算日地距离的精确方法. 然而, 老英雄 Halley 壮志未酬, 因为 1656 年生的他注定等不到这一天的来临. 1769 年 (1761 年那次金星凌日由于技术原因没有成功) , 通过欧洲的科学家的观测以及与在 Tahiti 岛的英国航海家 James Cook 船长的观测 (英法正处战争, 法国政府特别下令要保护 Cook 的船以保证测量的进行) , 之后不久法国人 Lalande 据此算出了地球与太阳间的距离大约为 亿公里 () . 据此, 我们可以算出太阳的质量是 .

我们现在简单描述金星凌日的基本想法. 在下图中, 我们用 表示地球的球心所在的位置, 用 表示太阳的中心的位置, 表示金星的位置. 相比于地球到太阳的距离 和金星到太阳的距离 , 这三个星球的半径都可以忽略.

MathAnalysis Venus.svg
在金星凌日的时刻, 我们假设在地球上的上半球 点有人观测太阳, 他将看到金星在太阳上的影子在 处; 同样地, 我们不妨假设在下半球对称的位置 处有人观测, 她将看到金星的影子投在了太阳上的 处. 根据照片上 的位置以及相机焦距的性质, 我们可以算出角度 , 也就是说 是通过测量可以知道的.

由于地球和太阳相距特别远, 所以我们可以假设 . 类似地, 我们有 . 根据三角形外角的性质, 我们有从而, . 根据正弦定理, 我们有上面我们用到了当 足够小的时候, . 从而, 我们得到如下的近似等式又因为 , 所以

另外, 我们可以通过天文观测来得到地球和金星的运行周期 (地球恰好是 1 年! ) , 根据 Kepler 的第三个定律, 我们就可以计算 (这因为这两个行星的轨道差不多就是圆) . 据此, 我们可以计算角度 . 我们可以在地球上计算 之间的距离 (测量! ) , 根据我们得到计算公式据此, 我们就可以计算地球到太阳的距离了.

空间曲线的长度

我们引入 (空间) 曲线和曲线的长度的概念. 假设 是有界区间, 考虑 的映射如果 的, 我们就将映射 称作是一条  的 (空间) 曲线. 有些书籍的作者会要求 , 这和子流形的概念相关, 我们会在下个学期进行系统的学习. 习惯上, 我们倾向于把映射的像 看做是曲线. 在做计算的时候, 我们则更关心如何通过一个映射 用一个区间 将这个曲线参数化的: 假设我们有连续可微的可逆的递增映射 , 那么我们可以考虑曲线的另一个参数化 : 很明显, 这两个参数化给出的曲线的像是一致的, 但是我们认为这是两条不同的曲线.

任意给定曲线 , 我们定义它的长度为 ( 速度的积分) : 我们强调, 对于 , 其长度 指的是如果换了参数化, 根据换元积分公式, 我们可以做如下的计算 (按照分量来计算! ) : 这表明一条曲线的长度的定义不依赖于参数化的选取.

注记. 如果我们仅仅和要求 是连续的而不是连续可微的, 我们就可以造出很奇怪的曲线, 比如说我们已经证明了存在可以填充 的曲线.

如果只能学习两条曲线的话, 那么我们没有选择:

例子. 我们研究直线和圆:

1)

直线段. 假设 中的两点, 它们之间的线段用 表示. 我们用 区间来参数化它: 据此, 我们有

2)

圆周. 我们把平面 上到原点的距离为 的点所组成的集合 称作是半径 的圆周. 根据对称性, 我们只考虑 的部分 (在第一象限的圆周) , 也就是四分之一个圆周, 它可以被下面的映射参数化: 我们还可以令 , 其中 (我们这里利用了 是连续可微的单调的可逆映射) , 那么就有四分之一个圆周的另一个参数化我们只利用解析意义下定义的 的性质 (这个参数化实际上就已经说明了经典意义下所定义的三角函数和我们所定义的是一致的) . 根据第二个参数化, 我们有所以圆的周长公式为 , 这就说明我们定义的 和经典意义下的 是一致的. 另外, 如果利用第一个参数化, 我们就有关于这个积分的计算实际上还是要做变量替换 .

我们中学知道两点之间线段最短, 然而, 只有有了微积分, 才可以正确地叙述并证明这个结论: 给定 , 我们考虑连接 的一族曲线: 其中对于每个固定的 , 都是曲线. 我们还要求所有曲线的起点和终点都分别是 , 即 , :

MathAnalysis N25P2.svg
我们可以认为这族曲线是曲线 的附近的一个小的扰动. 按照定义, 曲线 的长度为: 其中, 我们用 表示对 的导数. 如果 的长度是最短的, 那么根据极值的导数判定, 我们就应该有此时, 我们假设以上给出的曲线族是足够光滑的, 即 上是连续的并且 也是连续的. 这样, 我们就可以交换积分和求导, 得到最后一步是用了分部积分公式, 边界项消失是因为这族曲线在 处是不动的: 我们看看 的几何意义 (它被称作是这一族曲线的变分向量场) . 在每个点 处, 它表示的是曲线 在这个点处的切线, 如上面图形中红色向量所示. 这个计算中的红色等号成立是因为我们交换了两个算子 , 这是关于偏导数的基本性质, 我们下个学期会证明.

关键的观察是如果 的长度是最短, 不仅仅对于上面选定的这族曲线, 无论对于什么样的曲线族, 上面的导数都是 . 特别地, 任意给定连续可微的 , 下面这一族曲线的变分向量场恰好就是 . 所以, 对任意的连续可微、且满足 的向量场 , 我们都必须有特别地, 我们可以取 , 其中 (例如 ) . 所以, 这表明存在 , 使得对任意的 所以, 这条曲线为这显然是直线段.

当然, 你可能会对上面的证明有质疑, 因为两个点之间的最长的距离对这种求导数计算也成立, 想一下为什么这个不会发生. 实际上, 我们还可以计算 的二阶导数来说明 来说明这是最小值, 这里就不再展开讨论了.