다음을 통해 공유


series_cosine_similarity()

두 숫자 벡터의 코사인 유사성을 계산합니다.

이 함수 series_cosine_similarity() 는 두 개의 숫자 계열을 입력으로 사용하고 코사인 유사성계산합니다.

구문

series_cosine_similarity(series1, series2)

구문 규칙에 대해 자세히 알아봅니다.

매개 변수

이름 Type 필수 설명
series1, series2 dynamic ✔️ 숫자 데이터가 있는 입력 배열입니다.

반품

series2와 series1의 코사인 유사성 값이 있는 형식 real값을 반환합니다. 두 계열 길이가 같지 않은 경우 긴 계열은 더 짧은 계열의 길이로 잘립니다. 입력 계열의 숫자가 아닌 요소는 무시됩니다.

참고 항목

하나 또는 두 입력 배열이 모두 비어 있으면 결과는 다음과 같습니다 null.

성능 최적화

이 함수를 사용할 때 성능이 향상되고 스토리지 요구 사항이 감소하려면 ML 벡터 포함과 같이 64비트 정밀도가 필요하지 않은 부동 소수점 벡터를 저장하기 위한 인코딩 정책을 사용하는 Vector16 것이 좋습니다. Bfloat16 부동 소수점 표현을 활용하는 프로필은 Vector16 작업을 크게 최적화하고 스토리지 크기를 4단계로 줄일 수 있습니다. 인코딩 정책에 대한 Vector16 자세한 내용은 인코딩 정책 유형을 참조 하세요.

예시

datatable(s1:dynamic, s2:dynamic)
[
    dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
    dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 s2 cosine_similarity
[0.1,0.2,0.1,0.2] [0.11,0.2,0.11,0.21] 0.99935343825504
[0.1,0.2,0.1,0.2] [1,2,3,4] 0.923760430703401