找回密码
 快速注册
搜索
查看: 608|回复: 16

请教牛顿公式的应用

[复制链接]

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

abababa 发表于 2021-8-31 19:05 |阅读模式
题目和解答如图,我看不懂根据牛顿公式那部分,这是怎么得到$s_m-a_1s_{m-1}-a_2s_{m-2}-\cdots-a_{m-1}s_1=ma_m$的?

无标题.gif

730

主题

1万

回帖

9万

积分

积分
93593
QQ

显示全部楼层

kuing 发表于 2021-9-1 15:48
内容我是看不懂嘀,纯粹普及一下牛顿公式及推导。

记 `S_i=x_1^i+x_2^i+\cdots+x_n^i`,用 `\sigma_i` 表示各 `x_i` 的初等对称多项式(即 `\sigma_1=\sum\limits_{1\leqslant i\leqslant n}x_i`, `\sigma_2=\sum\limits_{1\leqslant i<j\leqslant n}x_ix_j` 等)。

牛顿等幂和公式是说:

(1)当 `k\geqslant n` 时,有
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^n\sigma_nS_{k-n}=0;\](2)当 `1\leqslant k\leqslant n` 时,有
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kk=0.\]
证明:
(1)因为
\[x^{k-n}(x-x_1)(x-x_2)\cdots(x-x_n)=x^k-\sigma_1x^{k-1}+\sigma_2x^{k-2}-\cdots+(-1)^n\sigma_kx^{k-n},\]分别令 `x=x_1`, `x_2`, \ldots, `x_n` 然后求和,左边全是零,右边就是 `S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^n\sigma_nS_{k-n}`,所以等式成立;

(2)令
\[f(x)=(x-x_1)(x-x_2)\cdots(x-x_n)=x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n,\]求导有
\[f'(x)=f(x)\sum_{i=1}^n\frac1{x-x_i}=nx^{n-1}-\sigma_1(n-1)x^{n-2}+\sigma_2(n-2)x^{n-3}-\cdots+(-1)^{n-1}\sigma_{n-1},\]
两边乘 `x^{k+1}`,得
\[f(x)\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1},\quad(*)\]由于
\[\frac{x^{k+1}}{x-x_i}=\frac{x^{k+1}-x_i^{k+1}}{x-x_i}+\frac{x_i^{k+1}}{x-x_i}=x^k+x_ix^{k-1}+x_i^2x^{k-2}+\cdots+x_i^{k-1}x+x_i^k+\frac{x_i^{k+1}}{x-x_i},\]故
\[\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k+\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i},\]所以式 (*) 化为
\[\begin{aligned} &f(x)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)+f(x)\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i}\\ ={}&nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1}, \end{aligned} \quad(**)\]比较式 (**) 等号两边的 `x^n` 的系数,等号右边是 `(-1)^k\sigma_k(n-k)`,至于等号左边,注意后面 `f(x)\sum\limits_{i=1}^n\frac{x_i^{k+1}}{x-x_i}` 的次数小于 `n`,不必考虑,只需考虑前面的展开,即
\[\bigl( x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n \bigr)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)\]的展开,易知其 `x^n` 的系数为 `S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn`,所以
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn=(-1)^k\sigma_k(n-k),\]即
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kk=0.\]

注:像(2)这么巧妙的证法我是想不出来嘀……

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

 楼主| abababa 发表于 2021-9-1 19:56
本帖最后由 abababa 于 2021-9-1 20:24 编辑 回复 2# kuing

谢谢,那这里的$S_k$,就相当于主楼里的$s_i$吧,因为$s_i=\lambda_1^i+\cdots+\lambda_n^i$,就相当于二楼的$S_i=x_1^i+\cdots+x_n^i$。

然后$a_1=p_1=\text{tr}(A_1)=\lambda_1+\cdots+\lambda_n$,就相当于一次齐次对称多项式,
\[a_2=p_2=\frac{1}{2}\text{tr}(A_2)=\frac{1}{2}\text{tr}(B_1A_1)=\frac{1}{2}\text{tr}((A_1-p_1E)A_1)=\frac{1}{2}\text{tr}(A_1^2)-\frac{1}{2}p_1\text{tr}(A_1)\]

因为$A^2$的特征值就是$A$的特征值的平方,迹就是特征值之和,所以$\text{tr}(A_1^2)=\lambda_1^2+\cdots+\lambda_n^2$,所以
\[a_2=\frac{1}{2}(\lambda_1^2+\cdots+\lambda_n^2)-\frac{1}{2}(\lambda_1+\cdots+\lambda_n)(\lambda_1+\cdots+\lambda_n)=-\sum_{1\le i<j\le n}\lambda_i\lambda_j\]

就是二次齐次对称多项式。
\begin{align*}
a_3&=p_3=\frac{1}{3}\text{tr}(A_3)=\frac{1}{3}\text{tr}(B_2A_1)=\frac{1}{3}\text{tr}(A_2A_1-p_2A_1)=\frac{1}{3}\text{tr}(B_1A_1^2-p_2A_1)\\
&=\frac{1}{3}\text{tr}((A_1-p_1E)A_1^2-p_2A_1)=\frac{1}{3}\text{tr}(A_1^3-p_1A_1^2-p_2A_1)\\
&=\frac{1}{3}[(\lambda_1^3+\cdots+\lambda_n^3)-(\lambda_1+\cdots+\lambda_n)(\lambda_1^2+\cdots+\lambda_n^2)+(\lambda_1+\cdots+\lambda_n)\sum_{1\le i<j\le n}\lambda_i\lambda_j]\\
&=\sum_{1\le i<j<k\le n}\lambda_i\lambda_j\lambda_k
\end{align*}

递推下去,可知$a_k$就是$k$次齐次多项式带上一个正负号。
就相当于二楼里的$\sigma_k$。那这样的话,结果应该是零啊,
\[S_m-\sigma_1S_{m-1}+\sigma_2S_{m-2}-\cdots+(-1)^{m-1}\sigma_{m-1}S_1\]

因为$m\ge1$,所以上式为零。

15

主题

958

回帖

1万

积分

积分
12454

显示全部楼层

色k 发表于 2021-9-1 20:06
回复 3# abababa

最后一项是不是搞错了?

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

 楼主| abababa 发表于 2021-9-1 20:23
本帖最后由 abababa 于 2021-9-1 21:22 编辑 回复 4# 色k

是的,指数应该是$(-1)^{m-1}$,正确的应该是$S_m-\sigma_1S_{m-1}+\sigma_2S_{m-2}-\cdots+(-1)^{(m-1)}\sigma_{m-1}S_1$,我改一下。

15

主题

958

回帖

1万

积分

积分
12454

显示全部楼层

色k 发表于 2021-9-1 20:46
回复 5# abababa

不只是次数问题,整个最后一项,你再看看。
另外那个m和n谁大?

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

 楼主| abababa 发表于 2021-9-1 21:09
回复 6# 色k

最后一项应该没什么错误了吧,我检查了应该是对的,不过这里确实应该是$m\le n$,所以应该用第二个公式,这样的话我就理解了,第二个公式多了一项$(-1)^m\sigma_m\cdot m$,而这一项恰好就等于$ma_m$。

830

主题

4862

回帖

3万

积分

积分
36159

显示全部楼层

isee 发表于 2021-9-3 00:08
回复 2# kuing


    难怪像韦达定理。这证明顺畅,但其实非常抽象,学习了

    牛顿等幂和公式,还有阿贝尔变换等等,都是平凡处一声惊雷

730

主题

1万

回帖

9万

积分

积分
93593
QQ

显示全部楼层

kuing 发表于 2021-9-3 02:27
回复 8# isee

这证明只有前半顺畅,后半很难想出来啊……

830

主题

4862

回帖

3万

积分

积分
36159

显示全部楼层

isee 发表于 2021-9-3 17:07
回复 9# kuing


所以牛顿“牛”~

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

 楼主| abababa 发表于 2021-9-4 10:26
找到以前的一个应用,具体证明不记得了,但确实是等幂和在一元二次方程中的使用:
应用.jpg

3149

主题

8386

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65391
QQ

显示全部楼层

hbghlyj 发表于 2022-4-1 08:52

设 $A$ 是 $n$ 阶矩阵, 我们按如下方式构造几个序列:
$$
\begin{array}{lll}
A_{1}=A, & p_{2}=\operatorname{tr} A_{1}, & B_{1}=A_{1}-p_{1} E, \\
A_{2}=B_{1} A, & p_{2}=\frac{1}{2} \operatorname{tr} A_{2}, & B_{2}=A_{2}-p_{2} E, \\
A_{3}=B_{2} A, & p_{3}=\frac{1}{3} \operatorname{tr} A_{3}, & B_{3}=A_{3}-p_{3} E, \\
A_{n}=B_{n-1} A, & p_{n}=\frac{1}{n} \operatorname{tr} A_{n},& B_{n}=A_{n}-p_{n} E .
\end{array}
$$
证明上述 $p_{1}, p_{2}, \cdots, p_{n}$ 是 $A$ 的特征多项式
$$
\Delta_{A}(\lambda)=|\lambda E-A|=\lambda^{n}-p_{1} \lambda^{n-1}-p_{2} \lambda^{n-2}-\cdots-p_{n}
$$
的系数, 并且 $B_{n}=0$. 当 $A$ 是可逆阵时, $A^{-1}=\frac{1}{p_{n}} B_{n-1}$.
证明: 设 $A$ 的特征多项式
$$
\Delta_{A}(\lambda)=|\lambda E-A|=\lambda^{n}-a_{1} \lambda^{n-1}-a_{2} \lambda^{n-2}-\cdots-a_{n},
$$
显然 $a_{1}=\operatorname{tr} A=\operatorname{tr} A_{1}=p_{1}$, 归纳地假设 $p_{1}=a_{1}, p_{2}=a_{2}, \cdots, p_{m-1}=a_{m-1}$, 我们来证 $p_{m}=a_{m}$. 从 $A_{1}, A_{2}, \cdots, A_{n} ; B_{1}, B_{2}, \cdots, B_{n}$; 以及 $p_{1}, p_{2}, \cdots, p_{n}$ 的构造方式容易得到
$$
\begin{aligned}
A_{m} &=A^{m}-p_{1} A^{m-1}-p_{2} A^{m 2}-\cdots-p_{m-1} A \\
&=A^{m}-a_{1} A^{m-1}-a_{2} A^{m-2}-\cdots-a_{m-1} A,
\end{aligned}
$$
因此得到
$$
\begin{aligned}
p_{m} &=\frac{1}{m} \operatorname{tr} A_{m}=\frac{1}{m} \operatorname{tr}\left(A^{m}-a_{1} A^{m-1}-a_{2} A^{m-2}-\cdots-a_{m-1} A\right) \\
&=\frac{1}{m}\left(\operatorname{tr} A^{m}-a_{1} \operatorname{tr} A^{m-1}-a_{2} \operatorname{tr} A^{m-2}-\cdots-a_{m-1} \operatorname{tr} A\right) \\
&=\frac{1}{m}\left(s_{m}-a_{1} s_{m-1}-a_{2} s_{m-2}-\cdots-a_{m-1} s_{1}\right),
\end{aligned}
$$
式中 $s_{i}=\lambda_{1}^{i}+\lambda_{2}^{i}+\cdots+\lambda_{n}^{i}, \lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}$ 是 $A$ 的 $n$ 个特征值.根据牛顿公式立即得到
$$
p_{m}=\frac{1}{m} \cdot m a_{m}=a_{m},
$$
这就证明了对一切 $1 \leqslant i \leqslant n, p_{i}=a_{i}$.
据凯莱-哈密顿定理知 $B_{n}=A^{n}-p_{1} A^{n-1}-p_{2} A^{n-2}-\cdots-p_{n} E=0$. 当 $A$ 可逆时, 从$B_n=B_{n-1}A-p_nE=0$和$p_n=\det A$知$A^{-1}=\frac1{p_n}B_{n-1}$.

413

主题

1558

回帖

1万

积分

积分
11498

显示全部楼层

 楼主| abababa 发表于 2022-4-1 09:41
回复 12# hbghlyj

不是书,是网上找的一个pdf文档,因为我做别的题时需要用这个牛顿公式,然后在网上搜了一下,找到一些文档,就把文档里的这部分看了,当时那部分看不懂,现在文档删了。而且这个文档我记得也不是关于牛顿公式的,而是关于凯莱-哈密顿定理的。

3149

主题

8386

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65391
QQ

显示全部楼层

hbghlyj 发表于 2022-4-1 09:50
回复 13# abababa
哦...那好吧

3149

主题

8386

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65391
QQ

显示全部楼层

hbghlyj 发表于 2022-4-1 10:25
我在wikipedia找到了1#这条结论:
Using Newton identities, the elementary symmetric polynomials can in turn be expressed in terms of power sum symmetric polynomials of the eigenvalues:
⋯⋯⋯

3149

主题

8386

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65391
QQ

显示全部楼层

hbghlyj 发表于 2025-2-9 05:02
kuing 发表于 2021-9-1 07:48
(2)令
\[f(x)=(x-x_1)(x-x_2)\cdots(x-x_n)=x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n,\]求导有
\[f'(x)=f(x)\sum_{i=1}^n\frac1{x-x_i}=nx^{n-1}-\sigma_1(n-1)x^{n-2}+\sigma_2(n-2)x^{n-3}-\cdots+(-1)^{n-1}\sigma_{n-1},\]
两边乘 `x^{k+1}`,得
\[f(x)\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1},\quad(*)\]由于
\[\frac{x^{k+1}}{x-x_i}=\frac{x^{k+1}-x_i^{k+1}}{x-x_i}+\frac{x_i^{k+1}}{x-x_i}=x^k+x_ix^{k-1}+x_i^2x^{k-2}+\cdots+x_i^{k-1}x+x_i^k+\frac{x_i^{k+1}}{x-x_i},\]故
\[\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k+\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i},\]所以式 (*) 化为
\[\begin{aligned} &f(x)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)+f(x)\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i}\\ ={}&nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1}, \end{aligned} \quad(**)\]比较式 (**) 等号两边的 `x^n` 的系数,等号右边是 `(-1)^k\sigma_k(n-k)`,至于等号左边,注意后面 `f(x)\sum\limits_{i=1}^n\frac{x_i^{k+1}}{x-x_i}` 的次数小于 `n`,不必考虑,只需考虑前面的展开,即
\[\bigl( x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n \bigr)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)\]的展开,易知其 `x^n` 的系数为 `S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn`,所以
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn=(-1)^k\sigma_k(n-k),\]即
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kk=0.\]

注:像(2)这么巧妙的证法我是想不出来嘀……


对于(2)$k<n$,还有一种证法,可以分析展开中各单项式来论证。参见 web.stanford.edu/~marykw/classes/CS250_W19/Netwons_Identities.pdf
Screenshot 2025-02-08 210303.png

3149

主题

8386

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65391
QQ

显示全部楼层

hbghlyj 发表于 2025-2-9 05:07
kuing 发表于 2021-9-1 07:48
(2)令
\[f(x)=(x-x_1)(x-x_2)\cdots(x-x_n)=x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n,\]求导有
\[f'(x)=f(x)\sum_{i=1}^n\frac1{x-x_i}=nx^{n-1}-\sigma_1(n-1)x^{n-2}+\sigma_2(n-2)x^{n-3}-\cdots+(-1)^{n-1}\sigma_{n-1},\]
两边乘 `x^{k+1}`,得
\[f(x)\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1},\quad(*)\]由于
\[\frac{x^{k+1}}{x-x_i}=\frac{x^{k+1}-x_i^{k+1}}{x-x_i}+\frac{x_i^{k+1}}{x-x_i}=x^k+x_ix^{k-1}+x_i^2x^{k-2}+\cdots+x_i^{k-1}x+x_i^k+\frac{x_i^{k+1}}{x-x_i},\]故
\[\sum_{i=1}^n\frac{x^{k+1}}{x-x_i}=nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k+\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i},\]所以式 (*) 化为
\[\begin{aligned} &f(x)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)+f(x)\sum_{i=1}^n\frac{x_i^{k+1}}{x-x_i}\\ ={}&nx^{n+k}-\sigma_1(n-1)x^{n+k-1}+\sigma_2(n-2)x^{n+k-2}-\cdots+(-1)^{n-1}\sigma_{n-1}x^{k+1}, \end{aligned} \quad(**)\]比较式 (**) 等号两边的 `x^n` 的系数,等号右边是 `(-1)^k\sigma_k(n-k)`,至于等号左边,注意后面 `f(x)\sum\limits_{i=1}^n\frac{x_i^{k+1}}{x-x_i}` 的次数小于 `n`,不必考虑,只需考虑前面的展开,即
\[\bigl( x^n-\sigma_1x^{n-1}+\sigma_2x^{n-2}-\cdots+(-1)^n\sigma_n \bigr)(nx^k+S_1x^{k-1}+S_2x^{k-2}+\cdots+S_{k-1}x+S_k)\]的展开,易知其 `x^n` 的系数为 `S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn`,所以
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kn=(-1)^k\sigma_k(n-k),\]即
\[S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kk=0.\]

注:像(2)这么巧妙的证法我是想不出来嘀……

对于(2),更巧妙的证法(只有一句话):
注意到$S_k-\sigma_1S_{k-1}+\sigma_2S_{k-2}-\cdots+(-1)^{k-1}\sigma_{k-1}S_1+(-1)^k\sigma_kk$展开后的每一项只含有$k$个变量$x_i$,要证明恒等式左边等于0只需要证明每个项的系数为0,固定一项,令该项中未出现的 $n-k$ 个变量$x_i$都为0,化为 $n=k$ 时的恒等式,左边等于0,该项的系数不变,从而该项的原来的系数为0.

手机版|悠闲数学娱乐论坛(第3版)

GMT+8, 2025-3-4 06:59

Powered by Discuz!

× 快速回复 返回顶部 返回列表