如何使用余弦相似度计算器
余弦相似度计算器通过计算 -1 到 1 之间的分数,衡量两个向量在方向上的相似程度。输入逗号分隔的数字向量(例如 1, 2, 3),余弦相似度计算器立即返回相似度分数、点积以及两个向量的模长。
- 向量 A — 输入第一个向量,用逗号分隔,例如
1, 2, 3或0.5, -1, 2。 - 向量 B — 输入第二个向量,元素数量必须与向量 A 相同。
- 查看结果 — 余弦相似度计算器会显示余弦相似度分数、点积 A · B、模长 ‖A‖ 和 ‖B‖,以及通俗的相似程度解释。
两个向量均不能为零向量,且长度必须相等。
公式与原理 - 余弦相似度计算器
余弦相似度计算器使用以下公式:
余弦相似度(A, B) = (A · B) / (‖A‖ × ‖B‖)
| 符号 | 含义 |
|---|---|
| A · B | 点积:Σ(Aᵢ × Bᵢ) |
| ‖A‖ | 向量 A 的欧氏模长:√(Σ Aᵢ²) |
| ‖B‖ | 向量 B 的欧氏模长:√(Σ Bᵢ²) |
该公式本质上计算两个向量夹角 θ 的余弦值。结果接近 1 表示夹角接近 0°(方向相同),结果为 0 表示夹角为 90°(正交),结果接近 -1 表示方向相反(180°)。余弦相似度计算器具有尺度不变性,即只关注方向而非大小。例如,向量 [1, 2, 3] 和 [2, 4, 6] 的余弦相似度恰好为 1。
使用限制
- 向量元素必须为实数,且两个向量长度必须相等。
- 零向量(所有元素均为 0)会导致除以零,计算器将拒绝此类输入。
- 本工具仅用于学习与分析,生产环境中请自行处理数值边界情况。
余弦相似度计算器的适用场景
余弦相似度计算器广泛应用于多个领域:
- 文本挖掘与自然语言处理 — 比较 TF-IDF 或词向量,衡量文档或句子的语义相似度。
- 推荐系统 — 通过比较用户或物品的偏好向量,实现基于协同过滤的推荐。
- 机器学习 — 在 k 近邻等算法中评估特征向量的方向相似性。
- 线性代数学习 — 验证向量夹角计算,理解正交性概念。
- 数据分析 — 在不受数值大小影响的前提下,衡量多维数据点之间的方向相关性。
使用余弦相似度计算器可以快速评估两组数值特征在方向上的契合程度,为建模决策和手动计算验证提供直观依据。