矩阵和线性方程组#

矩阵的基本概念#

矩阵的定义#

矩阵是由 \(m \times n\) 个数排成的 \(m\) 行 \(n\) 列的矩形数表，通常用大写字母表示：

\[A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\]

其中 \(a_{ij}\) 称为矩阵 \(A\) 的第 \(i\) 行第 \(j\) 列元素，记作 \(A = (a_{ij})_{m \times n}\) 或 \(A_{m \times n}\)。

特殊矩阵#

方阵：行数与列数相等的矩阵，即 \(m = n\) 的矩阵。

零矩阵：所有元素都为零的矩阵，记作 \(O\) 或 \(0\)。

单位矩阵：主对角线元素为1，其余元素为0的 \(n\) 阶方阵，记作 \(I_n\) 或 \(E_n\)：

\[I_n = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix}\]

对角矩阵：除主对角线外其余元素都为零的方阵，记作 \(\text{diag}(d_1, d_2, \ldots, d_n)\)。

上三角矩阵：主对角线下方的元素都为零的方阵。

下三角矩阵：主对角线上方的元素都为零的方阵。

对称矩阵：满足 \(A^T = A\) 的方阵，即 \(a_{ij} = a_{ji}\)。

反对称矩阵：满足 \(A^T = -A\) 的方阵，即 \(a_{ij} = -a_{ji}\)，主对角线元素必为零。

矩阵的运算#

矩阵的加法#

设 \(A = (a_{ij})_{m \times n}\)，\(B = (b_{ij})_{m \times n}\) 为同型矩阵，则它们的和定义为：

\[A + B = (a_{ij} + b_{ij})_{m \times n}\]

运算法则： 1. 交换律：\(A + B = B + A\) 2. 结合律：\((A + B) + C = A + (B + C)\) 3. 零元：\(A + O = A\) 4. 负元：\(A + (-A) = O\)

数乘运算#

设 \(k\) 为数，\(A = (a_{ij})_{m \times n}\) 为矩阵，则数乘定义为：

\[kA = (ka_{ij})_{m \times n}\]

运算法则： 1. \((k + l)A = kA + lA\) 2. \(k(A + B) = kA + kB\) 3. \((kl)A = k(lA)\) 4. \(1A = A\)

矩阵的乘法#

设 \(A = (a_{ij})_{m \times s}\)，\(B = (b_{ij})_{s \times n}\)，则矩阵乘积 \(AB\) 定义为 \(m \times n\) 矩阵 \(C = (c_{ij})_{m \times n}\)，其中：

\[c_{ij} = \sum_{k=1}^{s} a_{ik}b_{kj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{is}b_{sj}\]

注意：矩阵乘法要求左矩阵的列数等于右矩阵的行数。

\(c_{ij} =\) \(A\) 第 \(i\) 行 \(\times\) \(B\) 第 \(j\) 列

运算法则： 1. 结合律：\((AB)C = A(BC)\) 2. 左分配律：\((A + B)C = AC + BC\) 3. 右分配律：\(C(A + B) = CA + CB\) 4. 数乘结合：\(k(AB) = (kA)B = A(kB)\) 5. 单位元：\(AI_n = I_m A = A\)

特别注意： - 矩阵乘法一般不满足交换律：\(AB \neq BA\) - \(AB = O\) 不能推出 \(A = O\) 或 \(B = O\) - \(AB = AC\) 且 \(A \neq O\) 不能推出 \(B = C\)

矩阵的转置#

将矩阵 \(A\) 的行与列互换得到的矩阵称为 \(A\) 的转置矩阵，记作 \(A^T\)：

\[\text{若 } A = (a_{ij})_{m \times n}, \text{ 则 } A^T = (a_{ji})_{n \times m}\]

运算性质： 1. \((A^T)^T = A\) 2. \((A + B)^T = A^T + B^T\) 3. \((kA)^T = kA^T\) 4. \((AB)^T = B^T A^T\)

矩阵的秩#

子式与行列式#

在 \(m \times n\) 矩阵 \(A\) 中，任取 \(k\) 行 \(k\) 列（\(k \leq \min(m, n)\)），位于这些行列交叉处的 \(k^2\) 个元素按原来顺序组成的 \(k\) 阶行列式，称为矩阵 \(A\) 的 \(k\) 阶子式。

秩的定义#

矩阵 \(A\) 中不等于零的子式的最高阶数称为矩阵 \(A\) 的秩，记作 \(\text{rank}(A)\) 或 \(r(A)\)。

约定：零矩阵的秩为0。

秩的性质#

\(0 \leq \text{rank}(A_{m \times n}) \leq \min(m, n)\)
\(\text{rank}(A^T) = \text{rank}(A)\)
\(\text{rank}(kA) = \text{rank}(A)\)（\(k \neq 0\)）
\(\text{rank}(A + B) \leq \text{rank}(A) + \text{rank}(B)\)
\(\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))\)
若 \(A_{m \times n}B_{n \times l} = O\)，则 \(\text{rank}(A) + \text{rank}(B) \leq n\)

满秩矩阵#

对于 \(n\) 阶方阵 \(A\)，如果 \(\text{rank}(A) = n\)，则称 \(A\) 为满秩矩阵或非奇异矩阵；否则称为降秩矩阵或奇异矩阵。

逆矩阵#

逆矩阵的定义#

设 \(A\) 是 \(n\) 阶方阵，如果存在 \(n\) 阶方阵 \(B\)，使得

\[AB = BA = I_n\]

则称 \(A\) 是可逆矩阵或非奇异矩阵，\(B\) 称为 \(A\) 的逆矩阵，记作 \(A^{-1}\)。

可逆的充要条件#

\(n\) 阶方阵 \(A\) 可逆的充要条件是：

\(|A| \neq 0\)（行列式不为零）
\(\text{rank}(A) = n\)（满秩）
\(A\) 的行（列）向量组线性无关
齐次线性方程组 \(Ax = 0\) 只有零解
对任意 \(n\) 维列向量 \(b\)，方程组 \(Ax = b\) 有唯一解

逆矩阵的性质#

\((A^{-1})^{-1} = A\)
\((kA)^{-1} = \frac{1}{k}A^{-1}\)（\(k \neq 0\)）
\((AB)^{-1} = B^{-1}A^{-1}\)
\((A^T)^{-1} = (A^{-1})^T\)，记作 \(A^{-T}\)
\(|A^{-1}| = |A|^{-1}\)

逆矩阵的计算#

方法一：伴随矩阵法

\[A^{-1} = \frac{1}{|A|} A^*\]

其中 \(A^*\) 是 \(A\) 的伴随矩阵。

方法二：初等变换法

对增广矩阵 \((A | I)\) 进行初等行变换，当左边变为 \(I\) 时，右边即为 \(A^{-1}\)：

\[(A | I) \xrightarrow{\text{初等行变换}} (I | A^{-1})\]

初等变换与初等矩阵#

初等行变换#

倍乘变换：将某一行乘以非零常数 \(k\)
互换变换：互换两行的位置
倍加变换：将某一行的 \(k\) 倍加到另一行

初等矩阵#

由单位矩阵 \(I\) 经过一次初等变换得到的矩阵称为初等矩阵。

性质： 1. 初等矩阵都是可逆的，其逆矩阵仍是同类型的初等矩阵 2. 对矩阵 \(A\) 进行一次初等行变换，相当于左乘相应的初等矩阵 3. 对矩阵 \(A\) 进行一次初等列变换，相当于右乘相应的初等矩阵

等价矩阵#

如果矩阵 \(A\) 经过有限次初等变换可以变为矩阵 \(B\)，则称 \(A\) 与 \(B\) 等价，记作 \(A \sim B\)。

性质： 1. 反身性：\(A \sim A\) 2. 对称性：若 \(A \sim B\)，则 \(B \sim A\) 3. 传递性：若 \(A \sim B\)，\(B \sim C\)，则 \(A \sim C\) 4. 等价矩阵有相同的秩

线性方程组#

线性方程组的表示#

含有 \(n\) 个未知数 \(m\) 个方程的线性方程组：

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \cdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases}\]

矩阵形式：

\[Ax = b\]

其中 \(A = (a_{ij})_{m \times n}\) 为系数矩阵，\(x = (x_1, \ldots, x_n)^T\) 为未知数向量，\(b = (b_1, \ldots, b_m)^T\) 为常数项向量。

增广矩阵：

\[\bar{A} = (A | b) = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{pmatrix}\]

齐次线性方程组#

当常数项 \(b = 0\) 时，方程组 \(Ax = 0\) 称为齐次线性方程组。

基本性质： 1. 齐次线性方程组一定有解（至少有零解 \(x = 0\)） 2. 若 \(x_1, x_2\) 是解，则 \(k_1x_1 + k_2x_2\) 也是解（解空间构成线性空间）

非齐次线性方程组#

当 \(b \neq 0\) 时，方程组 \(Ax = b\) 称为非齐次线性方程组。

线性方程组解的判定#

克拉默法则#

对于 \(n\) 个方程 \(n\) 个未知数的线性方程组 \(Ax = b\)，若系数行列式 \(|A| \neq 0\)，则方程组有唯一解：

\[x_j = \frac{|A_j|}{|A|}, \quad j = 1, 2, \ldots, n\]

其中 \(A_j\) 是将 \(A\) 的第 \(j\) 列替换为 \(b\) 得到的矩阵。

齐次线性方程组解的判定#

对于齐次线性方程组 \(Ax = 0\)（\(A\) 为 \(m \times n\) 矩阵）：

只有零解 \(\Leftrightarrow\) \(\text{rank}(A) = n\)
有非零解 \(\Leftrightarrow\) \(\text{rank}(A) < n\)
当 \(m < n\) 时，方程组一定有非零解

非齐次线性方程组解的判定#

对于非齐次线性方程组 \(Ax = b\)（\(A\) 为 \(m \times n\) 矩阵）：

设 \(r = \text{rank}(A)\)，\(\bar{r} = \text{rank}(\bar{A})\)，则：

无解 \(\Leftrightarrow\) \(\bar{r} > r\)（即 \(\text{rank}(\bar{A}) > \text{rank}(A)\)）
有唯一解 \(\Leftrightarrow\) \(\bar{r} = r = n\)
有无穷多解 \(\Leftrightarrow\) \(\bar{r} = r < n\)

线性方程组的解法#

高斯消元法#

通过对增广矩阵进行初等行变换，将其化为行阶梯形矩阵或行最简形矩阵。

步骤： 1. 对增广矩阵 \(\bar{A}\) 进行初等行变换 2. 化为行阶梯形矩阵，判断解的情况 3. 继续化为行最简形矩阵 4. 写出方程组的解

齐次线性方程组的解结构#

设齐次线性方程组 \(Ax = 0\) 的系数矩阵 \(A\) 为 \(m \times n\) 矩阵，\(\text{rank}(A) = r < n\)。

基础解系：齐次线性方程组的解空间的一组基，包含 \(n - r\) 个线性无关的解向量 \(\xi_1, \xi_2, \ldots, \xi_{n-r}\)。

通解形式：

\[x = k_1\xi_1 + k_2\xi_2 + \cdots + k_{n-r}\xi_{n-r}\]

其中 \(k_1, k_2, \ldots, k_{n-r}\) 是任意常数。

非齐次线性方程组的解结构#

设非齐次线性方程组 \(Ax = b\) 有解，\(\eta\) 是其一个特解，\(\xi_1, \ldots, \xi_{n-r}\) 是对应齐次方程组 \(Ax = 0\) 的基础解系，则非齐次方程组的通解为：

\[x = \eta + k_1\xi_1 + k_2\xi_2 + \cdots + k_{n-r}\xi_{n-r}\]

即：非齐次方程组的通解 = 特解 + 齐次方程组的通解。

矩阵的分块#

分块矩阵的定义#

将矩阵用若干横线和竖线分成若干小块，每个小块称为子块，以子块为元素的矩阵称为分块矩阵。

分块矩阵的运算#

加法：对应子块相加（要求分块方式相同）。

数乘：每个子块乘以该数。

乘法：按矩阵乘法规则，但元素换成子块（要求分块相容）。

转置：先转置位置，再对每个子块转置。

分块对角矩阵#

形如 \(A = \begin{pmatrix} A_1 & & \\ & \ddots & \\ & & A_s \end{pmatrix}\) 的矩阵，其中 \(A_1, \ldots, A_s\) 都是方阵。

性质： 1. \(|A| = |A_1| \cdot |A_2| \cdots |A_s|\) 2. 若每个 \(A_i\) 可逆，则 \(A^{-1} = \begin{pmatrix} A_1^{-1} & & \\ & \ddots & \\ & & A_s^{-1} \end{pmatrix}\)

应用与意义#

矩阵理论和线性方程组在众多领域有广泛应用：

工程计算：结构分析、电路分析、控制系统
计算机图形学：图像变换、3D建模、动画制作
数据分析：线性回归、主成分分析（PCA）
机器学习：神经网络、支持向量机、矩阵分解
物理学：量子力学、振动理论、电磁场理论
经济学：投入产出分析、线性规划
密码学：Hill密码、矩阵加密算法

总结#

矩阵是线性代数的核心工具，为处理多元线性关系提供了简洁有力的数学语言。线性方程组的理论建立在矩阵理论的基础上，通过矩阵的秩、初等变换等工具，我们可以系统地研究线性方程组的解的存在性、唯一性和解的结构。矩阵理论不仅是纯数学研究的重要分支，更是现代科学技术不可或缺的数学基础，在计算机科学、数据科学、工程技术等领域发挥着核心作用。掌握矩阵理论和线性方程组的求解方法，是深入学习高等数学和应用数学的关键一步。