你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
series_cosine_similarity ()
计算两个数值向量的余弦相似度。
函数 series_cosine_similarity()
采用两个数值序列作为输入,并计算它们的 余弦相似性。
语法
series_cosine_similarity(
series1,
series2)
详细了解语法约定。
参数
名称 | 类型 | 必需 | 说明 |
---|---|---|---|
series1, series2 | dynamic |
✔️ | 使用数值数据的输入数组。 |
返回
返回类型的 real
值,其值为 series1 与 series2 的余弦相似性。
如果两个序列长度不相等,则较长的序列将截断为较短序列的长度。
将忽略输入序列的任何非数值元素。
备注
如果一个或两个输入数组为空,则结果为 null
。
优化性能
为了在使用此函数时增强性能和降低存储要求,请考虑使用 Vector16
编码策略来存储不需要 64 位精度的浮点向量,例如 ML 矢量嵌入。 该 Vector16
配置文件利用 Bfloat16 浮点表示形式,可以显著优化操作并将存储大小减少 4 倍。 有关编码策略的 Vector16
更多详细信息,请参阅 编码策略类型。
示例
datatable(s1:dynamic, s2:dynamic)
[
dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 | s2 | cosine_similarity |
---|---|---|
[0.1,0.2,0.1,0.2] | [0.11,0.2,0.11,0.21] | 0.99935343825504 |
[0.1,0.2,0.1,0.2] | [1,2,3,4] | 0.923760430703401 |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈