均值定理的意义是什么?
均值定理 设 $f$ 是从闭区间 $[a,b]$ 到实数的连续函数,并且假设 $f$ 在开区间 $(a,b)$ 内处处可导。那么在 $(a,b)$ 内存在某点 $c$ 使得 $f'(c)$ 等于 $(f(b)-f(a))/(b-a)$。
该定理的一个用途在于证明一个许多人错误地认为不需要证明的陈述:
(*) 如果函数 $f$ 的导数在每个点都严格为正,那么 $f$ 是严格递增函数。
这里,我假设 $f$ 是实值函数,并定义在某个实数区间上。为什么这个陈述常常被认为是显而易见的,而实际上并不显而易见呢?要回答这两个问题,让我首先讨论一下“显而易见”这个词。
当一个证明瞬间浮现在脑海中时,一个陈述就是显而易见的。
这个定义的优点当然是,它让那些问“但为什么这不显而易见?”的本科生无话可说。然而,它也有助于诊断他们的问题,因为当一个陈述 看起来 显而易见时,往往是因为一个证明 看起来 瞬间浮现在脑海中。只有当人们试图弄清半成品论证的细节时,才会意识到为什么论证是错误的,陈述并不显而易见。
那么,是什么半成品的论点导致许多人认为上述陈述 (*) 是显而易见的呢?
这里有两种可能性。
- 函数在 $x$ 处的导数是该函数在 $x$ 处图形的斜率。如果导数是正的,
这意味着斜率是正的。换句话说,图形向上倾斜。但如果图形在每个 $x$ 处都向上倾斜,
那么当然 $f$ 是严格递增的。(打个比方,假设你在山路上行走,每一步都发现自己在向上走,
这需要相当大的体力。如果过了一会儿你发现自己的海拔 下降 ,你会非常沮丧。)
- 假设 $f$ 在 $x$ 处的导数是正数 $a$。那么当 $h$ 趋于零时,$(f(x+h)-f(x))/h$ 的极限是 $a$,
这意味着对于足够小的 $h$,我们知道 $(f(x+h)-f(x))/h$ 非常接近 $a$。特别地,如果 $h$
足够小,那么 $(f(x+h)-f(x))/h$ 是正的。如果另外 $h$ 是正的,那么这只是说 $f(x+h)$ 大于 $f(x)$。
换句话说,在 $x$ 右边有一个小区间 $(x,y]$,对于该区间内的每个 $t$,我们有 $f(t) > f(x)$。
但我们可以对 每个 $x$ 这样做,所以 $f$ 当然是严格递增的。
现在让我们看看这两个论点有什么问题。第一个问题是,为了使其有意义,必须精确地定义诸如斜率 和梯度 在$x$处的概念。一旦定义清楚,可能最终会得到论点(ii),所以我将集中讨论那个论点。选择攻击它的地方并不难,因为它一开始非常精确(可以想象它是以极大的自信说出来的),但到最后变得有些模糊(语气变得更尖锐)。特别是,斜体字和词语当然 是一个明显的标志。一个重要的假设,几乎但不完全明确地在论点的结尾提出,是以下假设。
(**) 定义一个函数$f$为局部严格递增,如果对于每个$x$,存在一个$y > x$,使得对于半开区间$(x,y]$中的每个$t$,$f(t) > f(x)$。然后一个函数是严格递增的,如果(当然只有在)它是局部严格递增的。
假设某人认为(*)是显而易见的,并通过提出论点(ii)来证明这一信念,那么他显然认为假设(**)是显而易见的。但它显而易见吗?让我们尝试与之前相同的技术,通过写下任何立即想到的东西来证明它。我们应该从记住严格递增函数的定义开始:如果$x < z$,则$f$是严格递增的,这意味着$f(x) < f(z)$。(我选择字母$z$是为了避免与之前出现的$y$混淆。)那么,假设$x < z$(并且$x$和$z$都属于$f$的定义域)。在仅知道$f$是局部严格递增的情况下,我们如何证明$f(x) < f(z)$?
好吧,我们最好使用我们所知道的,所以为什么不从选择一些$y > x$开始,使得对于区间$(x,y]$中的每个$t$,$f(t) > f(x)$。如果$y > z$,那么我们将证明我们想要的,但生活可能不会如此仁慈。然而,即使$y < z$,它也比$x$更接近$z$,我们总是可以重复这个过程。凭借一点先见之明,让我们将$y$重命名为$y_{1}$。由于$f$是局部严格递增的,我们现在可以找到$y_2$,使得对于区间$(y_{1},y_{2}]$中的每个$t$,$f(t) > f(y_{1})$。这个过程可以继续下去,我们从中得到一个序列$y_{1} < y_{2} < y_{3} < ...$,其性质是$f(y_{1}) < f(y_{2}) < f(y_{3}) < ...$。问题是,当然,没有保证任何$y_{n}$会超过$z$。
另一方面,如果每个 $y_{n}$ 都小于 $z$,那么我们有一个有界的单调递增序列。因此它有一个极限,记作 $u$。看起来似乎 $f(u)$ 可能比所有的 $f(y_{n})$ 都大。我们该如何证明这一点呢?
似乎有一个问题:在每个 $y_{n}$ 的旁边,我们都有一个函数值更大的区间,但没有理由认为这些区间中的任何一个会超过 $u$。事实上,按照它们的定义,它们确实不会。更糟糕的是,这一观察很容易导致对断言 (**) 的反例:只需取一个在 $u$ 之前增加而在 $u$ 处突然下降的函数。例如,可以定义从 $[0,2]$ 到实数的函数 $f$,使得 $f(x)=x$ 如果 $x$ 在 $[0,1)$ 内,而 $f(x)=x-1$ 如果 $x$ 在 $[1,2]$ 内。根据给定的定义,这个函数是局部严格递增的。
这个看似严重的困难实际上并不难处理。局部严格递增函数的定义有些不自然,因为它只看任何给定数的右侧。当然(特别是考虑到刚才给出的例子),看两侧更自然。因此,我们将 (**) 重新表述如下。
(***) 定义一个函数 $f$ 为 局部 严格递增的,如果对于每个 $x$,存在一个 $c > 0$ 使得 $f(t) < f(x)$ 对于每个 $t$ 在半开区间 $[x-c,x)$ 内,并且 $f(t) > f(x)$ 对于每个 $t$ 在半开区间 $(x,x+c]$ 内。那么一个函数是严格递增的当且仅当它是局部严格递增的。
注意到具有严格正导数的函数在这个新意义上是局部严格递增的,所以让我们回到我们的论证。由于我们的定义比以前更强,我们仍然有我们的序列 $y_{1}, y_{2}, y_{3},...$,但这次我们可以对它的极限 $u$ 做更多的事情。根据局部严格递增的新定义,我们可以找到一个 $c > 0$ 使得 $f(t) < f(u)$ 对于每个 $t$ 在区间 $[u-c,u)$ 内。然而,这个区间包含了很多 $y_{n}$(因为 $y_{n}$ 趋向于 $u$),从而特别地,$f(u) > f(x)$。所以我们在向 $z$ 迈进了一小步。
现在我们可以重复整个过程,设 $u_{0}=u$ 并生成一个序列
$u_{0} < u_{1} < u_{2} < ...$ 使得
$f(u_{0}) < f(u_{1}) < f(u_{2}) < ...$
不言而喻,我们所有的问题都会重复,同样不言而喻,我们可以跨过它们,产生一个全新的序列,然后重复整个过程,一次又一次。
然后我们可以取所有这些序列,依此类推。
在这一点上,组织思路变得困难。然而,如果你看过我的另一页关于 [0,1] 上的连续函数 ,你会发现相同的困难也出现在那里。可以使用 序数 来解决这些困难,但有一个更整洁的方法,即以下论证,它证明了 (***),表明它并不明显(虽然也不特别难),并且突出了与连续函数结果的联系。
(***)的证明。 设 $x < z$。我们想要证明 $f(x) < f(z)$。为此,假设 $f(z)$ 不大于 $f(x)$ 并定义 $u$ 为第一个出错的点 ,或者更准确地说,定义 $B=\{t \in (x,z]: f(t)⩽f(x)\}$ 的下确界为 $u$。
(这个下确界存在,因为 $B$ 是有下界的并且包含 $z$。)
由于 $f$ 是局部严格递增的,存在一个 $v > u$ 使得在区间 $(u,v]$ 内的每个 $t$ 都有 $f(t) > f(u)$。因此 $u$ 不能等于 $x$,因为 $x$ 不属于 $B$,如果 $u=x$ 那么 $(x,v]$ 内的任何点也不属于 $B$。但 $f$ 是局部严格递增的,所以我们可以找到一个 $w < u$ 使得 $f(w) < f(u)$。
但这个 $w$ 属于 $B$,这与 $u$ 的定义相矛盾。
请注意,我们现在已经证明了具有严格正导数的函数是严格递增的——因为,正如我之前提到的,很容易证明它是局部严格递增的,根据第二个定义。
还要注意的是,克服这个困难有一个小但明确的难点。平均值定理的意义在于它可以用来处理这个难点。这里是从平均值定理推导 (*) 的通常的一行论证。
(*) 的第二个证明 假设 $f$ 不是严格递增的。那么我们可以找到 $x < y$ 使得 $f(y) \geq f(x)$。根据均值定理,在区间 $(x,y)$ 内存在某个 $c$ 使得 $f'(c) = (f(y) - f(x)) / (y - x)$,这小于或等于零。这与我们假设的 $f'$ 在每个地方都是正数相矛盾。
了解均值定理的证明依赖于闭区间上的连续函数是有界的并且达到其界限,这一点应该毫不奇怪,而证明这一点涉及到我们在证明 (*) 时遇到的完全相同的困难。换句话说,证明 (*) 确实存在一个真正的困难,但一旦你证明了均值定理,你就可以使用它并忘记这个困难。证明 (*) 仍然需要工作,但现在它隐藏在视线之外。这是数学中非常常见的现象的一个简单例子。
让我们进一步探讨 (***) 的证明与证明闭区间上的连续函数是有界的之间的联系。既然它们涉及到非常相似的困难,是否有某个引理可以证明,然后用来使这两个结果变得容易?
好吧,在这两种情况下,我们都有类似的情况。我们有一个函数 $f$,它在局部表现良好,我们想证明它在任何地方都表现良好。让我们比较一下这两种局部良好行为。
- 函数 $f$ 在 $x$ 附近表现良好,如果存在一个区间 $I = [x - c, x + c]$ 使得对于每个 $t \in I$,$|f(t) - f(x)| < 1$。(实际上,只要要求 $f$ 在 $I$ 中有界就足够了。)
- 函数 $f$ 在 $x$ 附近表现良好,如果存在一个区间 $I = [x - c, x + c]$ 使得当 $t$ 在 $I$ 中且 $t < x$ 时,$f(t) < f(x)$,并且当 $t$ 在 $I$ 中且 $t > x$ 时,$f(t) > f(x)$。
在这两种情况下,我们都知道 $f$ 在局部表现良好。我们还发现,如果我们可以用有限多个区间 $I$ 覆盖整个区间 $[a, b]$,那将非常有用。在第一种情况下,这保证了 $f$ 在 $[a, b]$ 上有界,而我们真正需要的是这样的一个引理。
引理 假设对于闭区间 $[a, b]$ 中的每个 $x$,我们都有一个包含 $x$ 的开区间 $I_{x}$。(如果 $x$ 是 $a$ 或 $b$,那么我们只要求 $I$ 是半开的。)那么存在一个有限序列 $a = x_{0}, x_{1}, x_{2}, ... x_{n} = b$,使得相应区间的并集是整个 $[a, b]$。
这个结果很容易看出等价于 Heine-Borel 定理,并且可以像我在特殊情况下证明它一样证明。
那么第二种情况呢?不幸的是,这个引理还不够,因为存在如下的例子。
假设a=0,b=1,
并且设$x_{1}=1/3$和$x_{2}=2/3$。设
$I(x_{1})=(1/6,1]$和$I(x_{2})=[0,5/6)$。
那么这两个区间(在$[0,1]$中是开的)覆盖了$[0,1]$,
但它们告诉我们的只是$f(0)< f(2/3)$,
$f(1/3)< f(2/3)$和$f(1/3)< f(1)$,这并不能证明
$f(0)< f(1)$。
这里是Heine-Borel定理的一个稍微加强的版本,它排除了上述类型的例子。
引理 假设对于闭区间$[a,b]$中的每个$x$,我们都有一个包含$x$的开区间$I_{x}$。
(如果$x$是$a$或$b$,那么我们只要求$I$是半开的。)那么存在一个有限序列
$a=x_{0}< x_{1}< x_{2}<
... < x_{n}=b$,使得相应区间的并集是整个$[a,b]$,
并且对于每个$j$,$I_{x_{j-1}}$
和$I_{x_{j}}$的交集是非空的。
证明 这几乎与Heine-Borel定理的通常证明相同。假设$[0,s]$可以适当地覆盖,
如果它可以写成有限个区间$I_{x_{j}}$的并集的子集,
并且$I_{x_{j-1}}$和$I_{x_{j}}$的交集总是非空的。
显然,如果$[0,s]$可以适当地覆盖,那么对于任何$t< s$,$[0,t]$也可以适当地覆盖。
现在设$u$为所有可以适当地覆盖$[0,s]$的$s$的上确界。
不可能$u< 1$且$[0,u]$可以适当地覆盖,因为使用的一个开区间将包含$u$,
因此包含一些$v> u$,这与$u$是上界相矛盾。
另一方面,如果对于每个$v< u$,$[0,v]$可以适当地覆盖,
那么取区间$I_{u}=(w,x)$并将其与$[0,w]$的适当覆盖结合起来。
假设这个适当覆盖是最小的,这意味着$w$属于
$I_{x_{k}}$,其中$k$是使用的最大的$j$。
由于$I_{x_{k}}$是开的,它与$I_{u}$
重叠,因此我们有$[0,u]$的适当覆盖。
这种情况唯一不会导致矛盾的是$u=1$且$[0,1]$
可以适当地覆盖。
下面是如何从稍微修改过的Heine-Borel定理推导出(*)的详细步骤。
(*) 的第三种证明 从可微性的定义可以很容易地得出,对于每个x,都存在一个区间$I=(x-c,x+c)$,使得对于小于x的每个$t\in I$,$f(t) < f(x)$,对于大于x的每个$t\in I$,$f(t) > f(x)$。(当x是a或b时,取半开区间。)这给我们提供了$[a,b]$的一个开覆盖。根据上面的引理,有一个由这些区间中的有限多个区间组成的适当覆盖。这为我们提供了一个序列$a=x_{0} < x_{1} < x_{2} < ...x_{n}=b$,使得相邻的$x_{j}$对应的区间重叠,这意味着$f(a)=f(x_{0}) < f(x_{1}) < ... < f(x_{n})=b$。(例如,要看到$f(x_{1}) < f(x_{2})$,选择一个介于$x_{1}$和$x_{2}$之间并属于两个区间的y。然后根据区间的构造方式,$f(x_{1}) < f(y) < f(x_{2})$。)由于这可以对$[a,b]$的任何子区间$[c,d]$进行,因此$f$在整个区间内严格递增。
练习 任何可以用Heine-Borel定理证明的东西也可以用Bolzano-Weierstrass定理证明。你能找到一种使用Bolzano-Weierstrass精神的证明(*)的方法吗?
(*) 的第四种证明 设 $a < b$。根据微积分基本定理,$f(b)-f(a)$ 是 $f'$ 从 $a$ 到 $b$ 的积分。由于 $f'$ 在每一点都是正的,这个积分是正的。
如果我们可以如此简单自然地推导出结果,为什么还要费心使用均值定理或上述任何一种论证呢?一个答案是,这个版本的微积分基本定理的通常证明使用了均值定理。另一个答案是,它要求 $f$ 的导数是黎曼可积的(并非所有可微函数都满足),因此它仅在稍强的假设下证明了 (*),尽管这个假设对大多数有趣的函数来说是成立的。
|