Skip to content

矩阵和线性方程组#

矩阵的基本概念#


矩阵的定义#

矩阵是由 \(m \times n\) 个数排成的 \(m\)\(n\) 列的矩形数表,通常用大写字母表示:

\[A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\]

其中 \(a_{ij}\) 称为矩阵 \(A\) 的第 \(i\) 行第 \(j\) 列元素,记作 \(A = (a_{ij})_{m \times n}\)\(A_{m \times n}\)


特殊矩阵#

方阵:行数与列数相等的矩阵,即 \(m = n\) 的矩阵。

零矩阵:所有元素都为零的矩阵,记作 \(O\)\(0\)

单位矩阵:主对角线元素为1,其余元素为0的 \(n\) 阶方阵,记作 \(I_n\)\(E_n\)

\[I_n = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix}\]

对角矩阵:除主对角线外其余元素都为零的方阵,记作 \(\text{diag}(d_1, d_2, \ldots, d_n)\)

上三角矩阵:主对角线下方的元素都为零的方阵。

下三角矩阵:主对角线上方的元素都为零的方阵。

对称矩阵:满足 \(A^T = A\) 的方阵,即 \(a_{ij} = a_{ji}\)

反对称矩阵:满足 \(A^T = -A\) 的方阵,即 \(a_{ij} = -a_{ji}\),主对角线元素必为零。


矩阵的运算#

矩阵的加法#

\(A = (a_{ij})_{m \times n}\)\(B = (b_{ij})_{m \times n}\) 为同型矩阵,则它们的和定义为:

\[A + B = (a_{ij} + b_{ij})_{m \times n}\]

运算法则: 1. 交换律:\(A + B = B + A\) 2. 结合律:\((A + B) + C = A + (B + C)\) 3. 零元:\(A + O = A\) 4. 负元:\(A + (-A) = O\)


数乘运算#

\(k\) 为数,\(A = (a_{ij})_{m \times n}\) 为矩阵,则数乘定义为:

\[kA = (ka_{ij})_{m \times n}\]

运算法则: 1. \((k + l)A = kA + lA\) 2. \(k(A + B) = kA + kB\) 3. \((kl)A = k(lA)\) 4. \(1A = A\)


矩阵的乘法#

\(A = (a_{ij})_{m \times s}\)\(B = (b_{ij})_{s \times n}\),则矩阵乘积 \(AB\) 定义为 \(m \times n\) 矩阵 \(C = (c_{ij})_{m \times n}\),其中:

\[c_{ij} = \sum_{k=1}^{s} a_{ik}b_{kj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{is}b_{sj}\]

注意:矩阵乘法要求左矩阵的列数等于右矩阵的行数。

\(c_{ij} =\) \(A\)\(i\)\(\times\) \(B\)\(j\)


运算法则: 1. 结合律:\((AB)C = A(BC)\) 2. 左分配律:\((A + B)C = AC + BC\) 3. 右分配律:\(C(A + B) = CA + CB\) 4. 数乘结合:\(k(AB) = (kA)B = A(kB)\) 5. 单位元:\(AI_n = I_m A = A\)

特别注意: - 矩阵乘法一般不满足交换律:\(AB \neq BA\) - \(AB = O\) 不能推出 \(A = O\)\(B = O\) - \(AB = AC\)\(A \neq O\) 不能推出 \(B = C\)


矩阵的转置#

将矩阵 \(A\) 的行与列互换得到的矩阵称为 \(A\) 的转置矩阵,记作 \(A^T\)

\[\text{若 } A = (a_{ij})_{m \times n}, \text{ 则 } A^T = (a_{ji})_{n \times m}\]

运算性质: 1. \((A^T)^T = A\) 2. \((A + B)^T = A^T + B^T\) 3. \((kA)^T = kA^T\) 4. \((AB)^T = B^T A^T\)


矩阵的秩#

子式与行列式#

\(m \times n\) 矩阵 \(A\) 中,任取 \(k\)\(k\) 列(\(k \leq \min(m, n)\)),位于这些行列交叉处的 \(k^2\) 个元素按原来顺序组成的 \(k\) 阶行列式,称为矩阵 \(A\)\(k\) 阶子式


秩的定义#

矩阵 \(A\) 中不等于零的子式的最高阶数称为矩阵 \(A\),记作 \(\text{rank}(A)\)\(r(A)\)

约定:零矩阵的秩为0。


秩的性质#

  1. \(0 \leq \text{rank}(A_{m \times n}) \leq \min(m, n)\)
  2. \(\text{rank}(A^T) = \text{rank}(A)\)
  3. \(\text{rank}(kA) = \text{rank}(A)\)\(k \neq 0\)
  4. \(\text{rank}(A + B) \leq \text{rank}(A) + \text{rank}(B)\)
  5. \(\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))\)
  6. \(A_{m \times n}B_{n \times l} = O\),则 \(\text{rank}(A) + \text{rank}(B) \leq n\)

满秩矩阵#

对于 \(n\) 阶方阵 \(A\),如果 \(\text{rank}(A) = n\),则称 \(A\)满秩矩阵非奇异矩阵;否则称为降秩矩阵奇异矩阵


逆矩阵#

逆矩阵的定义#

\(A\)\(n\) 阶方阵,如果存在 \(n\) 阶方阵 \(B\),使得

\[AB = BA = I_n\]

则称 \(A\)可逆矩阵非奇异矩阵\(B\) 称为 \(A\)逆矩阵,记作 \(A^{-1}\)


可逆的充要条件#

\(n\) 阶方阵 \(A\) 可逆的充要条件是:

  1. \(|A| \neq 0\)(行列式不为零)
  2. \(\text{rank}(A) = n\)(满秩)
  3. \(A\) 的行(列)向量组线性无关
  4. 齐次线性方程组 \(Ax = 0\) 只有零解
  5. 对任意 \(n\) 维列向量 \(b\),方程组 \(Ax = b\) 有唯一解

逆矩阵的性质#

  1. \((A^{-1})^{-1} = A\)
  2. \((kA)^{-1} = \frac{1}{k}A^{-1}\)\(k \neq 0\)
  3. \((AB)^{-1} = B^{-1}A^{-1}\)
  4. \((A^T)^{-1} = (A^{-1})^T\),记作 \(A^{-T}\)
  5. \(|A^{-1}| = |A|^{-1}\)

逆矩阵的计算#

方法一:伴随矩阵法

\[A^{-1} = \frac{1}{|A|} A^*\]

其中 \(A^*\)\(A\) 的伴随矩阵。

方法二:初等变换法

对增广矩阵 \((A | I)\) 进行初等行变换,当左边变为 \(I\) 时,右边即为 \(A^{-1}\)

\[(A | I) \xrightarrow{\text{初等行变换}} (I | A^{-1})\]

初等变换与初等矩阵#

初等行变换#

  1. 倍乘变换:将某一行乘以非零常数 \(k\)
  2. 互换变换:互换两行的位置
  3. 倍加变换:将某一行的 \(k\) 倍加到另一行

初等矩阵#

由单位矩阵 \(I\) 经过一次初等变换得到的矩阵称为初等矩阵

性质: 1. 初等矩阵都是可逆的,其逆矩阵仍是同类型的初等矩阵 2. 对矩阵 \(A\) 进行一次初等行变换,相当于左乘相应的初等矩阵 3. 对矩阵 \(A\) 进行一次初等列变换,相当于右乘相应的初等矩阵


等价矩阵#

如果矩阵 \(A\) 经过有限次初等变换可以变为矩阵 \(B\),则称 \(A\)\(B\) 等价,记作 \(A \sim B\)

性质: 1. 反身性:\(A \sim A\) 2. 对称性:若 \(A \sim B\),则 \(B \sim A\) 3. 传递性:若 \(A \sim B\)\(B \sim C\),则 \(A \sim C\) 4. 等价矩阵有相同的秩


线性方程组#

线性方程组的表示#

含有 \(n\) 个未知数 \(m\) 个方程的线性方程组:

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \cdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases}\]

矩阵形式:

\[Ax = b\]

其中 \(A = (a_{ij})_{m \times n}\)系数矩阵\(x = (x_1, \ldots, x_n)^T\)未知数向量\(b = (b_1, \ldots, b_m)^T\)常数项向量

增广矩阵:

\[\bar{A} = (A | b) = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{pmatrix}\]

齐次线性方程组#

当常数项 \(b = 0\) 时,方程组 \(Ax = 0\) 称为齐次线性方程组

基本性质: 1. 齐次线性方程组一定有解(至少有零解 \(x = 0\)) 2. 若 \(x_1, x_2\) 是解,则 \(k_1x_1 + k_2x_2\) 也是解(解空间构成线性空间)


非齐次线性方程组#

\(b \neq 0\) 时,方程组 \(Ax = b\) 称为非齐次线性方程组


线性方程组解的判定#

克拉默法则#

对于 \(n\) 个方程 \(n\) 个未知数的线性方程组 \(Ax = b\),若系数行列式 \(|A| \neq 0\),则方程组有唯一解:

\[x_j = \frac{|A_j|}{|A|}, \quad j = 1, 2, \ldots, n\]

其中 \(A_j\) 是将 \(A\) 的第 \(j\) 列替换为 \(b\) 得到的矩阵。


齐次线性方程组解的判定#

对于齐次线性方程组 \(Ax = 0\)\(A\)\(m \times n\) 矩阵):

  1. 只有零解 \(\Leftrightarrow\) \(\text{rank}(A) = n\)
  2. 有非零解 \(\Leftrightarrow\) \(\text{rank}(A) < n\)
  3. \(m < n\) 时,方程组一定有非零解

非齐次线性方程组解的判定#

对于非齐次线性方程组 \(Ax = b\)\(A\)\(m \times n\) 矩阵):

\(r = \text{rank}(A)\)\(\bar{r} = \text{rank}(\bar{A})\),则:

  1. 无解 \(\Leftrightarrow\) \(\bar{r} > r\)(即 \(\text{rank}(\bar{A}) > \text{rank}(A)\)
  2. 有唯一解 \(\Leftrightarrow\) \(\bar{r} = r = n\)
  3. 有无穷多解 \(\Leftrightarrow\) \(\bar{r} = r < n\)

线性方程组的解法#

高斯消元法#

通过对增广矩阵进行初等行变换,将其化为行阶梯形矩阵行最简形矩阵

步骤: 1. 对增广矩阵 \(\bar{A}\) 进行初等行变换 2. 化为行阶梯形矩阵,判断解的情况 3. 继续化为行最简形矩阵 4. 写出方程组的解


齐次线性方程组的解结构#

设齐次线性方程组 \(Ax = 0\) 的系数矩阵 \(A\)\(m \times n\) 矩阵,\(\text{rank}(A) = r < n\)

基础解系:齐次线性方程组的解空间的一组基,包含 \(n - r\) 个线性无关的解向量 \(\xi_1, \xi_2, \ldots, \xi_{n-r}\)

通解形式:

\[x = k_1\xi_1 + k_2\xi_2 + \cdots + k_{n-r}\xi_{n-r}\]

其中 \(k_1, k_2, \ldots, k_{n-r}\) 是任意常数。


非齐次线性方程组的解结构#

设非齐次线性方程组 \(Ax = b\) 有解,\(\eta\) 是其一个特解,\(\xi_1, \ldots, \xi_{n-r}\) 是对应齐次方程组 \(Ax = 0\) 的基础解系,则非齐次方程组的通解为:

\[x = \eta + k_1\xi_1 + k_2\xi_2 + \cdots + k_{n-r}\xi_{n-r}\]

即:非齐次方程组的通解 = 特解 + 齐次方程组的通解


矩阵的分块#

分块矩阵的定义#

将矩阵用若干横线和竖线分成若干小块,每个小块称为子块,以子块为元素的矩阵称为分块矩阵


分块矩阵的运算#

加法:对应子块相加(要求分块方式相同)。

数乘:每个子块乘以该数。

乘法:按矩阵乘法规则,但元素换成子块(要求分块相容)。

转置:先转置位置,再对每个子块转置。

分块对角矩阵#

形如 \(A = \begin{pmatrix} A_1 & & \\ & \ddots & \\ & & A_s \end{pmatrix}\) 的矩阵,其中 \(A_1, \ldots, A_s\) 都是方阵。

性质: 1. \(|A| = |A_1| \cdot |A_2| \cdots |A_s|\) 2. 若每个 \(A_i\) 可逆,则 \(A^{-1} = \begin{pmatrix} A_1^{-1} & & \\ & \ddots & \\ & & A_s^{-1} \end{pmatrix}\)


应用与意义#

矩阵理论和线性方程组在众多领域有广泛应用:

  1. 工程计算:结构分析、电路分析、控制系统
  2. 计算机图形学:图像变换、3D建模、动画制作
  3. 数据分析:线性回归、主成分分析(PCA)
  4. 机器学习:神经网络、支持向量机、矩阵分解
  5. 物理学:量子力学、振动理论、电磁场理论
  6. 经济学:投入产出分析、线性规划
  7. 密码学:Hill密码、矩阵加密算法

总结#

矩阵是线性代数的核心工具,为处理多元线性关系提供了简洁有力的数学语言。线性方程组的理论建立在矩阵理论的基础上,通过矩阵的秩、初等变换等工具,我们可以系统地研究线性方程组的解的存在性、唯一性和解的结构。矩阵理论不仅是纯数学研究的重要分支,更是现代科学技术不可或缺的数学基础,在计算机科学、数据科学、工程技术等领域发挥着核心作用。掌握矩阵理论和线性方程组的求解方法,是深入学习高等数学和应用数学的关键一步。