不用行列式的特征分析
打开本页,如果没有显示公式,请刷新页面。
在传统的线性代数教材中,行列式占据重要地位,其原因可能在于历史发展顺序。历史上,数学家们先研究怎么用行列式解线性方程组,而后才提出了矩阵等概念。
现在,有数学家提出了不同观点,认为在现代的线性代数中,可以抛弃行列式,最典型代表就是参考文献[1]的作者,美国数学家Sheldon Axler,参考文献[1]就是他的这种思想的集中体现。
下面参考文献[2],按照Sheldon Axler的思想,不用行列式,演示相关定理的证明。
设向量空间 中的线性变换 ,并 是一个子空间, 表示子空间向量经 映射后的像所成的集合,即 。
如果 ,则称 为线性变换 的一个不变子空间(invariant subspace)。
定理
定理1
对于 矩阵 ,若 为 的一个不变子空间,且 ,则存在非零特征向量 ,使得 。
证明
设 ,非零向量 ,向量集 属于 且线性相关。 维子空间不可能有 个线性无关的向量。所以,存在不全为零的数 ,使得:
成立。
设系数中最大值是 ,显然 ,则可以将 次多项式分解为:
其中 。
于是,(1.1)式的左侧多项式可以参考(1.2)式,分解为:
(1.3)式等号右边的乘法中,至少有一个 和向量 使得:
成立。
即 必定有一个特征向量 对应的特征值是 。
证毕。
定理2
对应相异特征值 的特征向量 组成一个线性无关的向量集合。
此定理在文献[3]中已经证明,并且没有使用行列式,下面的证明即来自文献[3]
证明1
设 为相异特征值, ,对应特征向量集合 ,考虑:
将(1.3)式等号两侧左乘 ,并且 ,得:
因为 ,且 ,所以: 。
同理,可得: 。
故 是一个完整的线性无关集合。
证毕。
证明2(反证法)
设 是线性相关集合,在不失一般性的原则下,设 是最大的线性无关集,则:
其中 不全为零(因为 )。
(1.4)式等号两侧分别左乘 ,可得:
且:
以上两式相减:
因为 是线性无关的向量集,且 两两相异,所以: 。与(1.4)式假设中的系数矛盾。故假设不成立。
证毕。
定理3
对于 中的特征向量,为了跟下面的(1.5)式进行区分,称为一般特征向量。而下面所定义的:
为特征值 对应的广义特征向量(generalized eigenvector),其中 是正整数。
广义特征向量所形成集合,以及零向量,也是 的一个子空间,即 ,称之为 广义特征空间 。具有如下性质:
若 是 阶方阵 的一个特征值,以 为指数,则:
证明
采用类似定理1的证明方法。
对线性组合:
两侧同乘: ,根据(1.5)可得:
所以: 。
如果两侧同乘以 ,同理可得 。
最终得到 。
证毕。
定理4
某一特征值 对应的代数重数 为广义特征向量集所张成的子空间维数,即 。
向量空间 可分为两个不相交的集合:广义特征空间 和值域 。
若 为 阶方阵 的一个特征值,则:
证明
由秩—零化度定理可知:
设 ,
则 且存在 使得 ,由此二式可得:
所以 。
根据定理3, ,所以:
证毕。
定理5
所有广义特征向量可张成 。
证明
将 分解为广义特征空间 和值域 。
对任意 , 可写为 ,所以:
即 ,也就是说 是 的一个不变子空间。
因为 。根据定理1,不变子空间必有一特征值,所以子空间 也可以分解为广义特征空间和另外一个不变子空间的直和。
继续按照上述方式分割不变子空间,直到整个 都被分解为广义特征空间为止。
所以,广义特征向量足以张成 。
定理6
子空间 仅有唯一特征值 。
证明
对于非零向量 ,设 且 ,则:
故:
但,已知 ,故 ,这与假设矛盾。所以:
证毕。
根据定理5,方阵 所有的广义特征向量可张成 ,而且对应相异特征值的广义特征向量是线性无关的,故 可表示为所有特征向量空间的直和:
即:
又因为: ,所以: 。
这说明特征值 的代数重数是 。
因为 ,对应特征值 的线性无关特征向量个数必定不大于线性无关的广义特征向量数。对应的几何重数就是线性无关的特征向量个数,而代数重数等于线性无关的广义特征向量重数。
故 对应的几何重数不大于代数重数。
参考文献
[1]. Sheldon Axler. 线性代数应该这样学. 北京:人民邮电出版社
[2]. 线代启示录:拒绝行列式的特征分析
[3]. 机器学习数学基础:矩阵对角化
[4]. 机器学习数学基础:秩—零化度定理
作者: 老齐
链接: http://math.itdiffer.com/nodeterminant.html
来源: 机器学习
本文原创发布于「机器学习」,转载请注明出处,谢谢合作!