series_cosine_similarity()
두 숫자 벡터의 코사인 유사성을 계산합니다.
이 함수 series_cosine_similarity()
는 두 개의 숫자 계열을 입력으로 사용하고 코사인 유사성을 계산합니다.
구문
series_cosine_similarity(
series1,
series2)
구문 규칙에 대해 자세히 알아봅니다.
매개 변수
이름 | Type | 필수 | 설명 |
---|---|---|---|
series1, series2 | dynamic |
✔️ | 숫자 데이터가 있는 입력 배열입니다. |
반품
series2와 series1의 코사인 유사성 값이 있는 형식 real
의 값을 반환합니다.
두 계열 길이가 같지 않은 경우 긴 계열은 더 짧은 계열의 길이로 잘립니다.
입력 계열의 숫자가 아닌 요소는 무시됩니다.
참고 항목
하나 또는 두 입력 배열이 모두 비어 있으면 결과는 다음과 같습니다 null
.
성능 최적화
이 함수를 사용할 때 성능이 향상되고 스토리지 요구 사항이 감소하려면 ML 벡터 포함과 같이 64비트 정밀도가 필요하지 않은 부동 소수점 벡터를 저장하기 위한 인코딩 정책을 사용하는 Vector16
것이 좋습니다. Bfloat16 부동 소수점 표현을 활용하는 프로필은 Vector16
작업을 크게 최적화하고 스토리지 크기를 4단계로 줄일 수 있습니다. 인코딩 정책에 대한 Vector16
자세한 내용은 인코딩 정책 유형을 참조 하세요.
예시
datatable(s1:dynamic, s2:dynamic)
[
dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 | s2 | cosine_similarity |
---|---|---|
[0.1,0.2,0.1,0.2] | [0.11,0.2,0.11,0.21] | 0.99935343825504 |
[0.1,0.2,0.1,0.2] | [1,2,3,4] | 0.923760430703401 |
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기