1. 什么是向量?

在数学中我们将即有大小,又有方向的量称为向量。在几何上,可以用有向线段 $\overrightarrow{AB}$ 来表示向量,其中 A、B 分别代表向量的起点和终点。不过在平常书写的时候,也经常会用黑体 $\boldsymbol{a}$、$\boldsymbol{b}$ 、$\boldsymbol{c}$ 等字母表示向量。

向量的大小(或长度)称为向量的模,记为 $\left \| \boldsymbol{a} \right \|$ 或 $ \left \| \overrightarrow{AB} \right \|$ 。模等于 1 的向量称为单位向量。模等于 0 的向量称为 零向量 ,记作 $\boldsymbol{0}$ ,零向量没有确定的方向。

在几何中,我们讨论的向量常常和向量的起点无关,这种不考虑起点的向量称为自由向量。换句话说,自由向量可以在空间中自由平行移动

自由向量

对于空间中的任意向量 $\boldsymbol{a}$ 作平行移动,使其起点为坐标原点 O,则可以通过向量的方向和长度推算出向量的终点 P。反之,如果给出一点向量终点 P,则可以确认向量 $\overrightarrow{OP}$ ,也就是说,空间中的点与向量之间可以建立一一对应的关系。

如果已知 P 点坐标为 $(x_1,y_1)$ ,则向量 $\overrightarrow{OP}$ 的坐标也可以用 $(x_1,y_1)$ 表示。因为向量是一种特殊的矩阵,所以向量同样可以用矩阵表达,其中 $(x_1,y_1)$ 可以表示矩阵的一行,所以类似这种 $1 \times n$ 的矩阵被称为 行矩阵。同理,向量也可以用矩阵的一列表示,而 $m \times 1$ 的矩阵被称为 列矩阵

向量既可以用行矩阵表示:$(x_1,y_1)$ ,也可以用列矩阵表示:$\begin{bmatrix} x_1 \\ y_1 \end{bmatrix}$,不过为了与点进行区分,一般情况下我们用列矩阵表示向量。

2. 向量的线性运算

对于向量 $\overrightarrow{OP} = (x_1,y_1)$ ,$x_1$、$y_1$ 被称为向量的分量,其中 $x_1$ 代表 $x$ 轴方向的分量,而 $y_1$ 则代表 $y$ 轴 方向的分量。

基于这些分量,我们可以定义向量的线性运算。其中包括加法规则,设向量 $\boldsymbol{a} = (a_1,a_2,a_3...)$ ,$\boldsymbol{b} = (b_1,b_2,b_3...)$ ,则向量 $\boldsymbol{a}+\boldsymbol{b}$ 等于:

$$
\boldsymbol{a} + \boldsymbol{b} = (a_1 + b_1, a_2 + b_2, a_3 + b_3 ...)
$$
以及乘法规则,设有一个数 $k$ ,则规定数乘法规则如下:
$$
k\boldsymbol{a} = (ka_1,ka_2,ka_3...)
$$

通过上面的两条规则,我们知道两个向量相加的结果仍然是一个向量,一个数乘以一个向量也同样是一个向量。下面我们在几何方向探索一下这两个基本法则:

向量线性运算

左边的图描述的是向量加法,其中 $\overrightarrow{OA} + \overrightarrow{OB} = \overrightarrow{OA} + \overrightarrow{AC} = \overrightarrow{OC}$,加法运算可以看作是多个向量的组合。你可以将一个向量描述成一个人从向量的起点走到向量的终点,左图可以描述成一个人想要从 O 走向 C,等价于先从 O 走向 A,再从 A 走向 C。右边是向量数乘运算,其中 $\overrightarrow{OE} = \lambda\overrightarrow{OD}$。数乘运算可以看作是对原有向量的缩放。

并且上面两种运算还满足以下八条运算规律:

  • $\boldsymbol{a} + \boldsymbol{b} = \boldsymbol{b} + \boldsymbol{a} $
  • $(\boldsymbol{a} + \boldsymbol{b}) + \boldsymbol{c} = \boldsymbol{a} + (\boldsymbol{b} + \boldsymbol{c})$
  • $\boldsymbol{a} + \boldsymbol{0} = \boldsymbol{a}$
  • $\boldsymbol{a} + (-\boldsymbol{a}) = \boldsymbol{0}$
  • $1\boldsymbol{a} = \boldsymbol{a}$
  • $\lambda(\mu \boldsymbol{a}) = (\lambda\mu) \boldsymbol{a}$
  • $\lambda(\boldsymbol{a}+\boldsymbol{b}) = \lambda \boldsymbol{a} + \lambda \boldsymbol{b}$
  • $(\lambda + \mu) \boldsymbol{a} = \lambda \boldsymbol{a} + \mu \boldsymbol{a}$

简而言之,凡满足上述八条的加法及数乘运算,就称为线性运算。凡是定义了线性运算的集合,就称向量空间(线性空间),其中集合中的元素就称为向量。

3. 向量的线性组合

在二维平面直角坐标系中,在 $x$ 轴和 $y$ 轴分别取两个单位向量 $\boldsymbol{i}$、$\boldsymbol{j}$ ,即:
$$
\boldsymbol{i} = (1, 0) \
\boldsymbol{j} = (0, 1)
$$
则:
$$
\overrightarrow{OP} = x_1(1,0) + y_1(0,1) = x_1 \boldsymbol{i} + y_1 \boldsymbol{j}
$$
向量 $\overrightarrow{OP}$ 可以由基向量 $\boldsymbol{i}$ 、$\boldsymbol{j}$ 线性表出, 其中 $\boldsymbol{i}$、$\boldsymbol{j}$ 这样的向量被称为坐标系的基向量。不过,基向量并不是唯一的,你可以随便在二维平面上找两个不共线的向量(平行的两个向量被称为共线)作为基向量,并且你可以用这组基向量描述上面提到的向量 $\overrightarrow{OP}$ ,相比于上面的公式中的参数,其中 $x_1$ 和 $y_1$ 显然是一组新的值。不过一般情况下,我们都会使用上面提到的 $\boldsymbol{i}$ 和 $\boldsymbol{j}$ 做为基向量。

基向量

运用向量的线性运算法则可以将向量 $\overrightarrow{OP}$ 描述为向量 $\boldsymbol{i}$ 和 $\boldsymbol{j}$ 的数乘之和,而这种两个数乘向量的和被称为这两个向量的线性组合。在二维平面中,你可以用基向量的线性组合描述平面内中的任意一个向量,除非这两个基向量共线或者都为零向量。

我们把上述 $\boldsymbol{i}$ 和 $\boldsymbol{j}$ 所有线性组合所构成的向量集合称为 $\boldsymbol{i}$ 和 $\boldsymbol{j}$ 的张成空间。这些同维数所组成的集合被称为向量组。如果上述向量组中的两个向量共线,则它们的张成空间为平面中的一条直线,如果它们都是零向量,则它们的张成空间为平面中的一点。

数学描述如下:

设 $n$ 维向量组 $\boldsymbol{A} = \begin{Bmatrix} a_1,a_2,...,a_n \end{Bmatrix}$, 其所有的线性组合构成的集合为向量空间,也称为向量组 $\boldsymbol{A}$ 的张成空间,记作 $span(a_1,a_2,...,a_n)$ ,即:
$$
\boldsymbol{A} = span(a_1,a_2,...,a_p) = \begin{Bmatrix} k_1a_1 + k_2a_2 + ... + k_na_n, k_{1,2,...,n} \in \mathbb{R} \end{Bmatrix}
$$

也称 $span( a_1,a_2,...,a_n)$ 为向量组 $\boldsymbol{A}$ 所张成

当存在多个向量的时,如果其中一个向量可以由其余向量线性表出,或者说移除某个向量并不会减小张成空间,这种情况下,我们称它们是线性相关的,线性相关代表着某些向量落在了其余向量组合的张成空间中。反之,如果每个向量都给张成添加新的维度,则称它们为线性无关

数学描述如下:

设 $n$ 维向量组 $\boldsymbol{A} = \begin{Bmatrix} a_1,a_2,...,a_n \end{Bmatrix}$,若存在一组不全为零的数 $k_1,k_2,...,k_n$,使得:
$$
k_1a_1 + k_2a_2 + ... + k_na_n = 0
$$
则称 $a_1,a_2,...,a_n$ 线性相关;否则,称 $a_1,a_2,...,a_n$ 线性无关,即仅当 $k_1 = k_2 = ... = k_n = 0$ 时,上述公式才成立。

本节前面提及的空间向量的一组基被定义为:“张成该空间的一组线性无关向量组”。

个人感觉基的定义就像是盖房子的称重柱,这些柱子是撑起空间不可缺少的东西。如果想省料,你需要找出最少的柱子个数,它们应该是一组“线性无关”的柱子,每一个柱子都有其作用,缺一不可。