為什麼矩陣乘法可以找到最相似的向量？

矩陣乘法可以找到最相似的向量，通常是因為在向量空間中，點積可以衡量兩個向量之間的相似度。特別是當我們使用歸一化的向量時，點積計算出的就是餘弦相似度，它是衡量兩個向量方向相似度的常用方式。讓我們詳細探討為什麼矩陣乘法能夠找到最相似的向量。

在向量運算中，兩個向量 $\mathbf{a}$ 和 $\mathbf{b}$ 的點積定義為：

$\mathbf{a} \cdot \mathbf{b} = \sum_{i=1}^{n} a_i b_i$

幾何上，點積與這兩個向量的長度和它們之間的夾角相關：

$\mathbf{a} \cdot \mathbf{b} = |\mathbf{a}| |\mathbf{b}| \cos(\theta)$

其中：
$|\mathbf{a}|$ 和 $|\mathbf{b}|$ 分別是向量 $\mathbf{a}$ 和 $\mathbf{b}$ 的長度（即模）。

如果我們將所有向量歸一化為單位向量（即模長為 1），那麼它們的點積僅依賴於夾角的餘弦值，變成了餘弦相似度：

$\cos(\theta) = \frac{\mathbf{a} \cdot \mathbf{b}}{|\mathbf{a}| |\mathbf{b}|}$

餘弦相似度是常用的相似度度量方法，尤其是在高維空間下（如文本嵌入向量），它衡量的是兩個向量之間的方向相似性，而不是它們的距離或大小差異。其值介於 -1 到 1 之間：

因此，通過點積（即矩陣乘法）計算向量之間的餘弦相似度，可以找到最相似的向量。點積越大，兩個向量的方向越相似，點積的值最大時表示它們最相似。

在這個例子中，查詢向量與多個文檔向量之間的相似度通過矩陣乘法來計算。設查詢向量為 $\mathbf{q}$ ，所有文檔的嵌入向量組成一個矩陣 $\mathbf{D}$ （每一行是一個文檔的向量），那麼我們可以通過以下矩陣乘法計算查詢向量與所有文檔向量的點積：

$\mathbf{q} \cdot \mathbf{D}^T$

其中：

通過這個矩陣乘法，我們會得到一個 1×n 的向量，其中每個元素代表查詢向量與對應文檔向量的點積（即相似度分數）。通過比較這些分數，可以找到與查詢向量最相似的文檔。

因此，矩陣乘法是一種高效的相似度計算方法，能夠在向量空間中快速找到與查詢向量最相似的其他向量。