3 most important points
5 thoughts
Notes
概览
Question
求 ,使得线性方程组 ,其中
其解的数量可以根据 A 和增广矩阵 的秩来讨论:
是未知数的个数,即矩阵 的列数:
| 解的个数 | 条件 | 求解 |
|---|---|---|
| 1 | 系数矩阵的秩等于增广矩阵的秩,且这个秩等于未知数的个数 | 逆矩阵 |
| 0 | 系数矩阵的秩小于增广矩阵的秩 | 最小二乘 |
| 无穷 | 系数矩阵的秩等于增广矩阵的秩,且这个秩小于未知数的个数时 | 最小范数 |
最小二乘(Least Squares)和最小范数(Minimum Norm)是线性代数中两个重要的概念,尤其在求解线性方程组、优化问题和机器学习中广泛应用。它们分别用于处理超定方程(无精确解)和欠定方程(解不唯一)的情况,而伪逆(Pseudoinverse)在这两种情况下都能给出最优解。
逆矩阵
对于一个 的方阵 ,如果存在另一个同样大小的方阵 ,使得 ,其中 是 的单位矩阵,那么矩阵 就被称为矩阵 的逆矩阵,记作 。
矩阵有逆矩阵的条件是其行列式 不为零,即 。如果矩阵 的行列式为零,则称矩阵 为奇异矩阵,奇异矩阵没有逆矩阵。
求逆矩阵的方法有多种,其中一种常见的方法是使用伴随矩阵和行列式。对于矩阵 ,其逆矩阵可以表示为:
其中 是矩阵 的伴随矩阵,它是 的余子式矩阵的转置。余子式矩阵的每个元素是 中对应元素的代数余子式。
代数余子式
在 阶行列式中,把元素 所在的第 行和第 列划去后,留下来的 阶行列式叫做元素 的余子式,记作 ,将余子式 再乘以 记为 , 叫做元素 的代数余子式。
另一种常见的方法是高斯-若尔当消元法(Gauss-Jordan Elimination):
这种方法通过将原矩阵 与单位矩阵 合并成一个增广矩阵 ,然后进行行变换,直到增广矩阵的左边变为单位矩阵 ,此时右边即为 的逆矩阵 。
Tip
对于分块矩阵,如果矩阵可以被合理地分块,有时可以直接计算分块的逆矩阵,然后组合得到整个矩阵的逆。
伪逆
普通逆矩阵 仅适用于满秩方阵(行列式为0),而求解线性方程组时,针对任意矩阵(包括非方阵、奇异矩阵)的一种广义逆矩阵,常用于求解线性方程组、最小二乘问题等。
对于任意矩阵 ,其伪逆 满足以下 Moore-Penrose 条件:
- ( 对称)
- ( 对称)
| 秩条件 | 含义 | 求解 |
|---|---|---|
| 列满秩 | ||
| 行满秩 | ||
| 一般情况,使用 SVD | 设 ,则 ,其中 是将 非零元素取倒数后转置 |
最小二乘
当线性方程组 无解(即 不在 的列空间内),我们希望找到一个近似解 ,使得误差 最小。
最小二乘解 满足:
即,在所有可能的 中,选择使得 最接近 的那个。
使用伪逆:
正规方程
当 ,代入表格得最小二乘解为
正规方程(Normal Equation)是用于求解线性回归模型参数的一种方法,它直接通过计算公式得到最优解,而不需要像梯度下降法那样进行迭代。
正规方程的公式通常表示为:
对于小规模数据集,正规方程计算速度较快,无需迭代,可以直接得到最优解; 然而当特征数量很大时,计算 的逆矩阵非常耗时,计算复杂度较高,不如梯度下降法
几何意义
最小二乘解 使得 是 在 的列空间上的正交投影:
其中 是投影矩阵。
最小二乘的应用场景包括:
- 线性回归:拟合数据点 到直线 。
- 信号处理:滤波、去噪。
- 机器学习:参数估计(如线性回归、岭回归)。
最小范数
当线性方程组 有无穷多解(即 行不满秩,),我们希望从所有解中选择范数最小的解 ,即:
最小范数解 满足:
其中 是 的伪逆。
Transclude of 范数#^9b5360
在所有满足 的解中,最小范数解 位于 的行空间(即 与 的零空间正交)。
最小范数的应用场景包括:
- 欠定方程组:如传感器校准(方程数少于变量数)。
- 优化问题:在可行解中选择最“简单”的解(如最小能量控制)。
- 压缩感知(Compressed Sensing):寻找稀疏解(类似 -范数最小化)。
总结
| 逆矩阵 | 最小二乘 | 最小范数 | 伪逆 | |
|---|---|---|---|---|
| 使用情况 | 为方阵且满秩 | 列满秩或非方阵 方程无解(超定,) | 行满秩或非方阵 方程解不唯一(欠定,) | 任意矩阵 (包括非方阵、秩缺陷矩阵) |
| 目标 | 精确满足 | 最小化 (残差范数) | 满足 前提下,最小化 (解范数) | 统一实现上述两个目标 |
| 求解 | ||||
| 几何意义 | 坐标的线性变换,可完美逆变换 | 是 在 上的正交投影 | 位于 ,与 正交 | 自动实现上述两种几何意义 |
| 计算基础 | LU分解、高斯消元法等 | 正规方程(Normal Equation) | 类似正规方程 | 奇异值分解(SVD) |
| 典型应用 | 求解经典线性方程组、坐标变换、解密算法 | 线性回归、数据拟合、曲线拟合 | 欠定系统控制、资源分配、信号重构 | 机器学习(岭回归、PCA)、数值分析、控制系统、任何不适定问题 |