CREATE VECTOR INDEX (Transact-SQL) (미리보기)

적용 대상: SQL Server 2025 (17.x) Azure SQL Database SQL 데이터베이스 in Microsoft Fabric

가장 가까운 인접 항목 검색의 성능을 향상시키기 위해 벡터 열에 대략적인 인덱스를 만듭니다. 벡터 인덱싱 및 벡터 검색의 작동 방식과 정확한 검색과 근사 검색 간의 차이점에 대한 자세한 내용은 SQL Database 엔진의 벡터 검색 및 벡터 인덱스를 참조하세요.

Azure SQL Database 및 Fabric의 SQL 데이터베이스

이 기능은 미리보기 중입니다. 계속하기 전에 제한 사항 및 고려 사항을 확인합니다 .

비고

미리 보기 기능으로, 이 문서에 제시된 기술에는 Microsoft Azure 미리 보기에 대한 보충 사용 약관이 적용됩니다.

경고

사용 중단 알림: 이전 데이터 구조를 사용하여 만든 벡터 인덱스는 현재 릴리스에서 지원되지만 이후 버전에서는 사용 중지됩니다. 향후 호환성 및 최신 벡터 검색 기능에 대한 액세스를 보장하려면 이전 벡터 인덱스 버전 섹션에서 마이그레이션의 단계를 사용하여 기존 벡터 인덱 스를 마이그레이션합니다.

지역별 가용성

이 기능은 Microsoft Fabric의 Azure SQL Database 및 SQL 데이터베이스에 배포되고 있습니다. 롤아웃 중에 가용성 및 동작은 지역 및 인덱스 버전에 따라 달라질 수 있습니다. 기능 또는 구문을 사용할 수 없는 경우 배포가 완료되면 자동으로 사용할 수 있게 됩니다. 현재 지역 가용성 상태는 지역별 기능 가용성을 참조하세요.

SQL Server 2025 프리뷰 기능

SQL Server 2025에서는 이 기능이 미리보기 단계이며 변경될 수 있습니다. 이 기능을 사용하려면 PREVIEW_FEATURES을 사용하도록 설정해야 합니다.

사용하기 전에 현재 제한 사항을 확인해야 합니다.

비고

최신 버전의 벡터 인덱스는 현재 Microsoft Fabric의 Azure SQL Database 및 SQL 데이터베이스에서만 사용할 수 있습니다.

문법

Transact-SQL 구문 표기 규칙

CREATE VECTOR INDEX index_name
ON object ( vector_column )
[ WITH (
    [ , ] METRIC = { 'cosine' | 'dot' | 'euclidean' }
    [ [ , ] TYPE = 'DiskANN' ]
    [ [ , ] MAXDOP = max_degree_of_parallelism ]
) ]
[ ON { filegroup_name | "default" } ]
[;]

주장들

index_name

인덱스의 이름입니다. 인덱스 이름은 테이블 내에서 고유해야 하지만 데이터베이스 내에서 고유할 필요는 없습니다. 인덱 스 이름은 식별자 규칙을 따라야 합니다.

개체

인덱스가 만들어지는 테이블입니다. 기본 테이블이어야 합니다. 로컬 테이블과 전역 모두의 임시 테이블은 지원되지 않습니다.

vector_column

벡터 인덱스 만들기에 사용할 열입니다. 벡터 형식이어야 합니다.

메트릭

지정된 두 벡터 간의 거리를 계산하는 데 사용할 거리 메트릭의 이름을 가진 문자열입니다. 지원되는 거리 메트릭은 다음과 같습니다.

cosine - 코사인 거리
euclidean - 유클리드 거리
dot - (음수) 점 제품

TYPE

인덱스 작성에 사용되는 ANN 알고리즘 의 형식입니다. 현재는 DiskANN만 지원됩니다. DiskANN이 기본값입니다.

MAXDOP

인덱스 작업에 대한 최대 병렬 처리 수준 구성 옵션을 재정의합니다. 자세한 내용은 Server 구성을 참조하세요. 최대 병렬 처리 수준. MAXDOP 사용하여 인덱스 빌드 작업에 대한 병렬 처리 수준 및 결과 리소스 사용을 제한합니다.

max_degree_of_parallelism은 다음 중 하나일 수 있습니다.

1

병렬 계획 생성을 억제합니다.
>1

병렬 인덱스 작업에 사용되는 최대 병렬 처리 수준을 현재 시스템 워크로드에 따라 지정된 수 이하로 제한합니다.
0(기본값)

현재 시스템 워크로드에 따라 감소하지 않는 한 서버, 데이터베이스 또는 워크로드 그룹 수준에서 지정된 병렬 처리 수준을 사용합니다.

자세한 내용은 병렬 인덱스 작업 구성을 참조하세요.

비고

병렬 인덱스 작업은 일부 SQL Server 버전에서 사용할 수 있습니다. SQL Server 에디션에서 지원하는 기능 목록은 SQL Server 2022의 에디션 및 지원 기능 또는 SQL Server 2025의 에디션 및 지원 기능을 참조하십시오.

벡터 인덱스를 최신 버전으로 업그레이드

중요합니다

사용 중단 알림: 이전 데이터 구조를 사용하여 만든 벡터 인덱스는 현재 릴리스에서 지원되지만 이후 버전에서는 사용 중지됩니다. 향후 호환성 및 최신 벡터 검색 기능에 대한 액세스를 보장하려면 아래 단계를 사용하여 기존 벡터 인덱스를 마이그레이션합니다.

새로 만든 벡터 인덱스는 다음을 제공하는 최신 데이터 구조를 자동으로 사용합니다.

전체 DML 지원: 인덱스를 만든 후 벡터 인덱싱된 테이블을 읽기 전용으로 만든 이전 제한을 제거합니다. 이제 벡터 인덱스 기능을 유지하면서 자동 실시간 인덱스 유지보수를 통해 , , UPDATE, DELETEMERGE , 연산을 수행할 INSERT수 있습니다
반복 필터링: WHERE 절의 조건자는 검색 후가 아니라 벡터 검색 프로세스 중에 적용됩니다.
최적화 프로그램 기반: 쿼리 최적화 프로그램은 쿼리 특성에 따라 DiskANN 인덱스 또는 kNN 검색을 사용할지 여부를 자동으로 결정합니다.
고급 양자화: 벡터 정량화 기술이 통합되어 더 나은 스토리지 효율성과 더 빠른 쿼리 성능을 제공하며, 이러한 최적화는 사용자에게 투명하게 적용됩니다.

이전 벡터 인덱스 버전 제한 사항에 대한 자세한 내용은 제한 사항 및 고려 사항 섹션을 참조하세요.

이전 벡터 인덱스 버전에서 마이그레이션

최신 기능을 사용하려면 이전 버전을 사용하여 만든 벡터 인덱스를 삭제하고 다시 만들어야 합니다. 이 섹션에서는 벡터 인덱스 버전을 식별, 마이그레이션 및 확인하는 방법을 설명합니다.

1단계: 기존 벡터 인덱스 식별

다음 쿼리를 사용하여 마이그레이션이 필요한 벡터 인덱스를 식별합니다.

SELECT
    i.name AS index_name,
    t.name AS table_name,
    JSON_VALUE(v.build_parameters, '$.Version') AS index_version,
    CASE
        WHEN JSON_VALUE(v.build_parameters, '$.Version') >= '3'
            THEN 'Uses latest version (no migration required)'
        WHEN JSON_VALUE(v.build_parameters, '$.Version') < '3'
            THEN 'Created using an earlier version (migration recommended)'
        ELSE 'Unknown format'
    END AS migration_status
FROM sys.vector_indexes AS v
    INNER JOIN sys.indexes AS i
        ON v.object_id = i.object_id
        AND v.index_id = i.index_id
    INNER JOIN sys.tables AS t
        ON v.object_id = t.object_id
ORDER BY t.name, i.name;

결과를 해석하는 방법

최신 버전 사용

이미 반복 필터링, 전체 DML 지원, 최적화 프로그램 기반 실행 및 향상된 양자화를 지원합니다.
마이그레이션 필요 없음

이전 버전을 사용하여 생성됨

레거시 사후 필터 동작 사용
최신 벡터 검색 기능을 지원하지 않음
향후 호환성을 보장하기 위해 마이그레이션을 사용하는 것이 좋습니다.

2단계: 벡터 인덱스 삭제 및 다시 만들기

이전 형식을 사용하여 만든 벡터 인덱스는 현재 위치에서 업그레이드할 수 없습니다. 최신 DiskANN 기능을 사용하도록 설정하려면 인덱스 삭제 및 다시 만듭니다.

경고

서비스 영향: 벡터 인덱스를 삭제하면 인덱스가 다시 만들어질 때까지 영향을 받는 테이블에서 대략적인 벡터 검색이 즉시 비활성화됩니다. 프로덕션 시스템에 대한 유지 관리 기간 동안 마이그레이션을 계획합니다.

기존 인덱스 삭제

DROP INDEX vec_idx ON dbo.wikipedia_articles;

인덱스 다시 생성

CREATE VECTOR INDEX vec_idx
    ON dbo.wikipedia_articles (title_vector)
    WITH (
        TYPE = 'DISKANN',
        METRIC = 'COSINE'
    );

비고

현재 CREATE VECTOR INDEX 문을 사용하여 만든 벡터 인덱스는 자동으로 최신 DiskANN 형식을 사용합니다. 추가 옵션 또는 플래그가 필요하지 않습니다.

3단계: 인덱스 버전 확인

다시 수행한 후 인덱스가 최신 버전을 사용하고 있는지 확인합니다.

SELECT
    i.name AS index_name,
    t.name AS table_name,
    JSON_VALUE(v.build_parameters, '$.Version') AS index_version
FROM sys.vector_indexes AS v
    INNER JOIN sys.indexes AS i
        ON v.object_id = i.object_id
        AND v.index_id = i.index_id
    INNER JOIN sys.tables AS t
        ON v.object_id = t.object_id
WHERE i.name = 'vec_idx';

열은 index_version 최신 버전에 대해 표시 3 되어야 합니다.

버전 비호환성 오류 동작

최신 버전 벡터 인덱스와 함께 매개 변수 TOP_N 를 사용 VECTOR_SEARCH 하려는 경우 SQL Server는 다음 오류를 반환합니다.

Msg 42274, Level 16, State 1
Vector search with version 3 index does not support explicit TOP_N parameter.

이 오류를 해결하려면 매개 변수를 TOP_N 제거하고 대신 구문을 사용합니다VECTOR_SEARCH.SELECT TOP (N) WITH APPROXIMATE 자세한 내용은 레거시 구문을 사용하는 오류를 참조하세요.

제한 사항 및 고려 사항

이전 벡터 인덱스 버전 제한 사항

이전 벡터 인덱스 버전에는 다음과 같은 추가 제한 사항이 있습니다. 인덱스 버전을 확인하려면 인덱스 버전 확인을 참조하세요.

필터링 후만: 조건자는 검색 프로세스 중에가 아니라 벡터 검색 후에만 적용됩니다. 이로 인해 필터를 적용할 때 예상보다 적은 수의 행이 반환될 수 있습니다.
읽기 전용 테이블: 벡터 인덱스가 있는 테이블은 읽기 전용입니다. 벡터 인덱스가 생성된 후에는 DML 연산(INSERT, UPDATE, DELETE, MERGE)이 허용되지 않습니다. ALLOW_STALE_VECTOR_INDEX 부실 검색 결과를 허용할 수 있는 경우 데이터베이스 범위 구성을 사용하여 DML 작업을 사용하도록 설정합니다.
수동 TOP_N 튜닝: 필터링 후를 보정하기 위해 매개 변수 TOP_N 를 수동으로 조정 VECTOR_SEARCH 해야 하며, 원하는 수의 결과를 얻으려면 대개 큰 값이 필요한 경우가 많습니다.

현재 제한 사항(최신 버전에도 적용됨)

현재 미리 보기에는 다음과 같은 제한 사항이 있습니다.

벡터 인덱스는 분할할 수 없습니다. 파티션이 지원되지 않습니다.
테이블에는 기본 키 클러스터형 인덱스가 있어야 합니다.
벡터 인덱스는 구독자에 복제되지 않습니다.
벡터 인덱스가 있는 테이블은 .를 사용하여 TRUNCATE TABLE잘라낼 수 없습니다. 모든 데이터를 제거하려면 먼저 벡터 인덱스를 삭제하고 테이블을 잘라내고 100개 이상의 행으로 다시 채우고 인덱스를 다시 만듭니다. 자세한 내용은 제한 사항을 참조하세요TRUNCATE TABLE.
DacPac 또는 BACPAC를 사용하여 벡터 인덱스를 배포할 수 없습니다. 벡터 인덱스에는 생성 시 NULL이 아닌 벡터가 있는 행이 100개 이상 필요합니다. DacPac, BACPAC 또는 Import/Export 서비스를 사용하여 데이터베이스를 가져올 때 가져오기 프로세스는 데이터를 로드하기 전에 스키마 개체(벡터 인덱스 포함)를 만들어 가져오기가 실패합니다.

해결 방법: 데이터베이스를 내보내기 전에 벡터 인덱스를 삭제하고 가져온 후 인덱스를 다시 만듭니다.

최소 데이터 요구 사항

인덱스를 만들려면 벡터 인덱스가 NULL이 아닌 벡터 값이 있는 최소 행 수가 필요합니다.

최소 행 수: NULL이 아닌 벡터 값이 있는 100개 이상의 행이 테이블에 있어야 합니다.
오류 동작: 행이 100개 미만인 테이블에 벡터 인덱스를 만들려고 시도하면 오류 Msg 42266과 함께 실패합니다.

예제 오류:

Msg 42266, Level 16, State 1
Cannot create a vector index. The table contains only 8 rows with non-null vectors, 
but at least 100 are required for vector index creation.

모범 사례: 벡터 인덱스를 만들기 전에 테이블을 100개 이상의 행으로 채웁니다. 더 적은 수의 행이 필요한 VECTOR_SEARCH 개발 및 테스트 시나리오의 경우 무차별 암호 대입 검사 방법을 사용하는 인덱스 없이 작동하지만 더 큰 데이터 세트로 성능이 저하됩니다.

DML 지원

최신 버전을 사용하여 DiskANN 벡터 인덱스가 만들어지면 테이블은 더 이상 읽기 전용이 아닙니다. 표준 DML(데이터 조작 언어) 작업을 사용하여 데이터를 자유롭게 수정할 수 있으며 변경 내용은 벡터 검색 결과에 자동으로 반영됩니다.

이 기능을 사용하면 시간이 지남에 따라 데이터가 변경되는 실시간 트랜잭션 워크로드에 벡터 검색이 적합합니다.

동작 정보

DML 작업은 벡터 인덱스를 삭제하거나 다시 작성할 필요가 없습니다.
변경 내용은 트랜잭션이 커밋된 후 벡터 검색 쿼리에 표시됩니다.
대규모 데이터 대체(예: 대부분의 행 삭제 및 완전히 새로운 포함 집합 삽입)의 경우 최적의 검색 품질을 보장하기 위해 데이터 로드 후 벡터 인덱스를 삭제하고 다시 만드는 것이 좋습니다.

비고

DML 지원은 최신 버전을 사용하여 만든 벡터 인덱스에만 사용할 수 있습니다. 이전 버전에서는 테이블이 읽기 전용이거나 데이터베이스 범위 구성을 ALLOW_STALE_VECTOR_INDEX 사용해야 합니다.

벡터 인덱스 유지 관리 모니터링

벡터 인덱스는 백그라운드 유지 관리를 수행하여 DML 변경 내용을 통합합니다. sys.dm_db_vector_indexes 동적 관리 뷰를 사용하여 인덱스 상태 및 유지 관리 작업 상태를 모니터링합니다.

기존 인덱스와 벡터 인덱스 결합

벡터 인덱스는 기존의 B-트리 인덱스와 함께 작동하여 최적의 쿼리 성능을 제공합니다. 반복 필터링을 VECTOR_SEARCH사용하는 경우 필터 조건자에 사용되는 열에 기존 인덱스를 만드는 것이 좋습니다.

반복 필터링 동작 및 이전 버전과 어떻게 다른지에 대한 자세한 내용은 반복 필터링 동작을 참조하세요.

팁 (조언)

쿼리 최적화 프로그램은 최상의 실행 전략(근사치 인접 인덱스 및 kNN 검색)을 자동으로 선택합니다. 근사한 인접 인덱스 사용을 강제하려면 테이블 힌트를 FORCE_ANN_ONLY 사용합니다. 자세한 내용은 벡터 검색에 대한 테이블 힌트를 참조하세요.

시나리오 예:

-- Create vector index for similarity search
CREATE VECTOR INDEX idx_embeddings_vector
ON product_embeddings(embedding)
WITH (METRIC = 'cosine');

-- Create traditional index for filter columns
CREATE NONCLUSTERED INDEX idx_embeddings_filters
ON product_embeddings(category);

성능 이점:

반복 필터링을 사용하여 쿼리를 실행할 때 SQL Server 쿼리 최적화 프로그램은 두 인덱스 형식을 모두 사용합니다.

DECLARE @qv VECTOR(1536) = AI_GENERATE_EMBEDDINGS(N'wireless headphones' USE MODEL EmbeddingModel);

SELECT TOP (10) WITH APPROXIMATE
    p.name,
    p.price,
    vs.distance
FROM products p
INNER JOIN VECTOR_SEARCH(
    TABLE = product_embeddings AS e,
    COLUMN = embedding,
    SIMILAR_TO = @qv,
    METRIC = 'cosine'
) AS vs ON p.id = e.product_id
WHERE e.approved = 1             
  AND e.category = 'Electronics'  -- Can use traditional index
ORDER BY vs.distance;

이 쿼리에서:

벡터 인덱스는 쿼리 벡터를 기반으로 유사한 포함을 식별합니다.
반복 검색 프로세스 중에 후보를 효율적으로 필터링하는 기존 인덱(category) 스

이 복합 전략은 특히 필터 조건자의 선택성이 높은 경우 벡터 인덱스만 사용하는 것과 비교하여 쿼리 성능을 크게 향상시킬 수 있습니다.

벡터 인덱스에 대한 데이터 품질 및 유지 관리 지침

중복 포함이 많은 데이터 세트 방지

벡터 인덱싱은 포함이 다양한 의미 체계 콘텐츠를 나타내는 경우에 가장 적합합니다. 중복 벡터 비율이 높은 데이터 세트는 벡터 인덱싱에 권장되지 않습니다.

중복이 많을 경우 다음이 발생할 수 있습니다.

결과 품질 저하: 중복 벡터가 결과에 반복적으로 표시되어 관련 의미 체계 일치가 더 많이 발생합니다.
효율성 감소: 중복 포함은 더 나은 이웃을 대체하여 유사성 검색의 유용성을 낮춥니다.
불필요한 리소스 사용: 벡터 인덱스는 빌드 및 유지 관리 비용이 많이 들고 중복은 가치를 추가하지 않고 비용을 추가합니다.

모범 사례: 성능과 결과 품질을 모두 개선하기 위해 벡터 인덱스를 만들기 전에 포함을 중복 제거합니다.

대규모 데이터 대체 시나리오

벡터 인덱스는 삽입, 업데이트 및 삭제를 지원합니다. 그러나 데이터 세트를 새 모델로 다시 포함하는 등 대부분의 또는 모든 포함이 대체되면 기존 인덱스는 더 이상 새 데이터 배포를 반영하지 않을 수 있습니다.

대규모 대체 시나리오에서:

벡터 검색 쿼리가 계속해서 유효한 결과를 반환합니다.
그러나 인덱스 구조가 다른 포함 분포를 위해 빌드되었기 때문에 회수 및 순위 품질이 저하될 수 있습니다.

모범 사례: 거의 완전한 데이터 대체(새 포함 항목 삭제 및 삽입)를 수행할 때 새 데이터를 로드한 후 벡터 인덱스를 삭제하고 다시 만듭니다. 인덱스를 다시 만들면 새 포함 배포에 최적화되고 예측 가능한 쿼리 동작이 복원됩니다.

알려진 문제

자세한 내용은 알려진 문제를 검토하세요.

권한

사용자에게 테이블에 대한 권한이 있어야 합니다 ALTER .

예시

벡터 포함 샘플이 포함된 Wikipedia 문서를 다운로드하고 가져옵니다.

위키백과 문서의 제목 포함을 저장하는 형식 wikipedia_articles 의 열 title_vector 이 있는 테이블 vector 이 있다고 가정합니다. title_vector 는 1,536차원의 벡터를 반환하는 text-embedding-ada-002 또는 text-embedding-3-small과 같은 포함 모델을 사용하여 생성된 포함으로 간주됩니다.

엔드투엔드 솔루션을 비롯한 더 많은 예제를 보려면 Azure SQL Database 벡터 검색 샘플 GitHub 리포지토리로 이동합니다.

예제 1

다음 예제에서는 메트릭을 사용하여 열에 title_vector 벡터 인덱스 만들기 cosine

CREATE VECTOR INDEX vec_idx
    ON [dbo].[wikipedia_articles] ([title_vector])
        WITH (METRIC = 'COSINE', TYPE = 'DISKANN');

예제 2

다음 예제에서는 (음수 title_vector ) 제품 메트릭을 사용하여 열에 벡터 인덱스(벡터 인덱스) dot 를 만들어 병렬 처리를 8로 제한하고 파일 그룹에 벡터를 SECONDARY 저장합니다.

CREATE VECTOR INDEX vec_idx
    ON [dbo].[wikipedia_articles] ([title_vector])
        WITH (METRIC = 'DOT', TYPE = 'DISKANN', MAXDOP = 8)
    ON [SECONDARY];

예제 3

기본 엔드 투 엔드 예제 사용 CREATE VECTOR INDEX 및 관련 VECTOR_SEARCH 함수입니다. 포함은 조롱됩니다. 실제 시나리오에서는 포함 모델 및 AI_GENERATE_EMBEDDINGS 사용하거나 OpenAI SDK와 같은 외부 라이브러리를 사용하여 포함이 생성됩니다.

비고

최신 버전 벡터 인덱스는 인덱스를 만들기 전에 100개 이상의 데이터 행이 필요합니다. 이 예제에서는 이 요구 사항을 충족하기 위해 100개의 행을 삽입합니다. 자세한 내용은 최소 데이터 요구 사항을 참조하세요.

다음 코드 블록은 모의 CREATE VECTOR INDEX 포함을 보여 줍니다.

미리 보기 기능을 사용하도록 설정합니다(SQL Server 2025에만 필요하고 Azure SQL Database 또는 Fabric의 SQL 데이터베이스에는 필요하지 않음).
데이터 형식 dbo.Articles가 있는 열 embedding 이 있는 샘플 테이블을 만듭니다.
모의 포함 데이터가 있는 샘플 데이터 행 100개 삽입
에서 벡터 인덱스 dbo.Articles.embedding만들기
함수를 사용하여 벡터 유사성 검색을 보여 줍니다 VECTOR_SEARCH .

-- Step 0: Enable Preview Feature (SQL Server 2025 only)
ALTER DATABASE SCOPED CONFIGURATION
SET PREVIEW_FEATURES = ON;
GO

-- Step 1: Create a sample table with a VECTOR(5) column
CREATE TABLE dbo.Articles
(
    id INT PRIMARY KEY,
    title NVARCHAR(100),
    content NVARCHAR(MAX),
    embedding VECTOR(5) -- mocked embeddings
);
GO

-- Step 2: Insert sample data (100 rows required for latest version indexes)
INSERT INTO Articles (id, title, content, embedding)
SELECT
    value AS id,
    'Article ' || [value],
    'Content for article ' || [value],
    CAST(JSON_ARRAY(
        CAST(value * 0.01 AS FLOAT),
        CAST(value * 0.02 AS FLOAT),
        CAST(value * 0.03 AS FLOAT),
        CAST(value * 0.04 AS FLOAT),
        CAST(value * 0.05 AS FLOAT)
    ) AS VECTOR(5))
FROM GENERATE_SERIES(1, 100);
GO

-- Step 3: Create a vector index on the embedding column
CREATE VECTOR INDEX vec_idx ON Articles(embedding)
WITH (METRIC = 'cosine', TYPE = 'diskann');
GO

-- Step 4: Perform a vector similarity search
DECLARE @qv VECTOR(5) = '[0.3, 0.3, 0.3, 0.3, 0.3]';
SELECT TOP(3) WITH APPROXIMATE
    t.id,
    t.title,
    t.content,
    s.distance
FROM
    VECTOR_SEARCH(
        TABLE = Articles AS t,
        COLUMN = embedding,
        SIMILAR_TO = @qv,
        METRIC = 'cosine'
    ) AS s
ORDER BY s.distance, t.title;

쿼리 구문은 벡터 인덱스 버전에 따라 달라집니다.

벡터 인덱스 버전	구문 예시
최신 버전	매개 변수 없이 `SELECT TOP (N) WITH APPROXIMATE` 사용 `TOP_N`
이전 버전(사용되지 않음)	함수에서 `TOP_N` 매개 변수 사용 `VECTOR_SEARCH`

이전 버전 인덱스의 경우(사용되지 않는 구문):

DECLARE @qv VECTOR(5) = '[0.3, 0.3, 0.3, 0.3, 0.3]';
SELECT TOP(3)
    t.id,
    t.title,
    t.content,
    s.distance
FROM
    VECTOR_SEARCH(
        TABLE = Articles AS t,
        COLUMN = embedding,
        SIMILAR_TO = @qv,
        METRIC = 'cosine',
        TOP_N = 3
    ) AS s
ORDER BY s.distance, t.title;

예제 4: DML 작업

다음 예제에서는 최신 버전을 사용하여 만든 벡터 인덱스가 있는 테이블에 대한 DML 작업을 보여 줍니다.

여러 행 삭제하기

행을 삭제하면 테이블 및 벡터 검색 결과 모두에서 행이 제거됩니다.

DELETE FROM dbo.wikipedia_articles
WHERE id = 12345;

삭제가 완료되면 제거된 행이 더 이상 벡터 검색 쿼리에 나타나지 않습니다.

새 행 삽입

포함하는 새 행을 삽입할 수 있으며 인덱스를 다시 작성하지 않고 즉시 검색할 수 있습니다.

INSERT INTO dbo.wikipedia_articles (id, title, title_vector)
VALUES (
    99999,
    N'Quantum Computing Basics',
    AI_GENERATE_EMBEDDINGS(N'Quantum Computing Basics' USE MODEL Ada2Embeddings)
);

새로 삽입된 포함은 자동으로 벡터 인덱스에 통합되며 후속 벡터 검색 쿼리에서 반환할 수 있습니다.

기존 행 업데이트

벡터 또는 비벡터 열 업데이트는 완전히 지원됩니다.

DECLARE @new_embedding VECTOR(1536);
SET @new_embedding = AI_GENERATE_EMBEDDINGS(N'Updated article title' USE MODEL Ada2Embeddings);

UPDATE dbo.wikipedia_articles
SET title_vector = @new_embedding,
    title = N'Updated article title'
WHERE id = 50000;

벡터 열이 업데이트되면 인덱스가 그에 따라 업데이트되므로 향후 벡터 검색에서 새 포함을 사용합니다.

복잡한 연산을 위한 사용 MERGE

이 MERGE 문을 사용하면 단일 문에서 삽입, 업데이트 및 삭제 작업을 수행할 수 있습니다.

MERGE INTO dbo.wikipedia_articles AS target
USING (
    SELECT 
        id,
        title,
        AI_GENERATE_EMBEDDINGS(title USE MODEL Ada2Embeddings) AS title_vector
    FROM dbo.staging_articles
) AS source
ON target.id = source.id
WHEN MATCHED THEN
    UPDATE SET 
        title = source.title,
        title_vector = source.title_vector
WHEN NOT MATCHED BY TARGET THEN
    INSERT (id, title, title_vector)
    VALUES (source.id, source.title, source.title_vector)
WHEN NOT MATCHED BY SOURCE AND target.id > 100000 THEN
    DELETE;

벡터 인덱스는 문의 모든 변경 내용을 MERGE 반영하도록 자동으로 업데이트됩니다.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-03-18