19 避免 NumPy 中的“秩1数组”（Rank-1 Array）陷阱

发表于 2025-12-15 本文字数： 721 阅读时长 ≈ 3 分钟

例如：将列向量与行向量相加，本应报错，但 NumPy 会自动广播并返回一个矩阵，而非报错。

　　当你执行：

a = np.random.randn(5)

💡 原因：NumPy 将 (5,) 视为一维数组，点积默认计算内积（inner product）。

列向量（column vector）：

a = np.random.randn(5, 1)  # shape: (5, 1)

行向量（row vector）：

a = np.random.randn(1, 5)  # shape: (1, 5)

操作	秩1数组 `(5,)`	列向量 `(5,1)`
`a.T`	仍是 `(5,)`，无变化	变为 `(1,5)` 行向量
`a @ a.T` 或 `np.dot(a, a.T)`	标量（内积）	$5 \times 5$ 矩阵（外积）

外积公式（outer product）：

若 $\mathbf{a} \in \mathbb{R}^{n \times 1}$，则

$$
\mathbf{a} \mathbf{a}^\top \in \mathbb{R}^{n \times n}
$$

assert a.shape == (5, 1), "a must be a column vector"

a = a.reshape(5, 1)   # 强制转为列向量
# 或
a = a.reshape(1, 5)   # 强制转为行向量

即使输入是 (5,)，reshape 后行为就变得可预测。

　　在深度学习中，我们频繁进行如下操作：

　　若向量维度不明确，广播机制可能导致：

✅ 显式维度 = 更少 bug + 更高可复现性

操作	秩1数组 `(5,)`	列向量 `(5,1)`	行向量 `(1,5)`
转置 `.T`	`(5,)`（不变）	`(1,5)`	`(5,1)`
`a @ a.T`	标量（内积）	$5 \times 5$ 矩阵	$1 \times 1$ 标量
`a.T @ a`	标量	$1 \times 1$ 标量	$5 \times 5$ 矩阵
广播加法 `a + b`	易出错	行为明确	行为明确