你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

series_cosine_similarity ()

计算两个数值向量的余弦相似度。

函数 series_cosine_similarity() 采用两个数值序列作为输入,并计算它们的 余弦相似性

语法

series_cosine_similarity( series1,series2)

详细了解语法约定

参数

名称 类型 必需 说明
series1, series2 dynamic ✔️ 使用数值数据的输入数组。

返回

返回类型的 real 值,其值为 series1series2 的余弦相似性。 如果两个序列长度不相等,则较长的序列将截断为较短序列的长度。 将忽略输入序列的任何非数值元素。

备注

如果一个或两个输入数组为空,则结果为 null

优化性能

为了在使用此函数时增强性能和降低存储要求,请考虑使用 Vector16 编码策略来存储不需要 64 位精度的浮点向量,例如 ML 矢量嵌入。 该 Vector16 配置文件利用 Bfloat16 浮点表示形式,可以显著优化操作并将存储大小减少 4 倍。 有关编码策略的 Vector16 更多详细信息,请参阅 编码策略类型

示例

datatable(s1:dynamic, s2:dynamic)
[
    dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
    dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 s2 cosine_similarity
[0.1,0.2,0.1,0.2] [0.11,0.2,0.11,0.21] 0.99935343825504
[0.1,0.2,0.1,0.2] [1,2,3,4] 0.923760430703401