벡터 인덱스 만들기

2025-06-21

Azure AI Search에서 검색 인덱스에 벡터를 저장하고 의미 체계 유사성에 따라 일치에 대한 벡터 쿼리를 보낼 수 있습니다. 벡터 인덱스는 벡터 필드, 비벡터 필드 및 벡터 구성 섹션이 있는 인덱스 스키마에 의해 정의됩니다.

인덱스 만들기 또는 업데이트 REST API는 벡터 인덱스 만들기를 만듭니다. Azure AI Search에서 벡터를 인덱싱하려면 다음 단계를 수행합니다.

기본 스키마 정의로 시작합니다.
벡터 알고리즘 및 선택적 압축을 추가합니다.
벡터 필드 정의를 추가합니다.
사전 벡터화된 데이터를 별도의 단계로 로드하거나 인덱싱 중에 데이터 청크 및 포함을 위해 통합 벡터화를 사용합니다.

이 문서에서는 설명을 위해 REST를 사용합니다. 기본 워크플로를 이해한 후에는 테스트 및 프로덕션 코드에서 벡터 사용에 대한 지침을 제공하는 azure-search-vector-samples 리포지토리에서 Azure SDK 코드 샘플을 계속 진행합니다.

팁

Azure Portal을 사용하여 벡터 인덱스 및 통합 데이터 청크 및 벡터화를 사용해 볼 수도 있습니다.

필수 조건

모든 지역 및 계층의 Azure AI Search 서비스 입니다. Azure AI 기술 및 벡터라이저와 통합 벡터화를 사용하려는 경우 Azure AI Search는 Azure AI Vision에서 호스트되는 포함 모델과 동일한 지역에 있어야 합니다.
원본 문서에는 인덱스에 업로드할 벡터 포함 이 있어야 합니다. 이 단계에 통합 벡터화를 사용할 수도 있습니다.
벡터 필드에 해당 제한을 할당할 수 있도록 포함을 만드는 모델의 차원 제한을 알고 있어야 합니다. text-embedding-ada-002의 경우 차원은 1536으로 고정됩니다. text-embedding-3-small 또는 text-embedding-3-large의 경우 차원 범위는 각각 1에서 1536, 1에서 3072까지입니다.
사용할 유사성 메트릭을 알아야 합니다. Azure OpenAI에 모델을 포함하는 경우 유사성은 .를 사용하여 cosine계산됩니다.
인덱스 만들기 방법을 알아야 합니다. 스키마에는 항상 문서 키 필드, 검색 또는 필터 필드 및 인덱싱 및 쿼리 중에 필요한 동작에 대한 기타 구성이 포함됩니다.

제한점

2019년 1월 이전에 만든 일부 검색 서비스는 벡터 인덱스를 만들 수 없습니다. 이 서비스가 적용되는 경우 벡터를 사용할 새 서비스를 만듭니다.

인덱싱을 위한 문서 준비

인덱싱하기 전에 벡터 및 비벡터 데이터 필드를 포함하는 문서 페이로드를 어셈블합니다. 문서 구조는 인덱스 스키마의 필드 컬렉션을 따라야 합니다.

원본 문서에서 다음 콘텐츠를 제공하는지 확인합니다.

콘텐츠	설명
고유 식별자	각 문서를 고유하게 식별하는 필드 또는 메타데이터 속성입니다. 모든 검색 인덱스에는 문서 키가 필요합니다. 문서 키 요구 사항을 충족하려면 원본 문서에 인덱스에 고유하게 식별되는 필드 또는 속성이 하나 있어야 합니다. Blob을 인덱싱하는 경우 metadata_storage_path가 각 Blob을 고유하게 식별하는 데 도움이 될 수 있습니다. 데이터베이스에서 인덱싱하는 경우 기본 키일 수 있습니다. 이 원본 필드는 검색 인덱스에서 `Edm.String` 및 `key=true` 형식의 인덱스 필드에 매핑해야 합니다.
비벡터 콘텐츠	다른 필드에 사람이 읽을 수 있는 콘텐츠를 제공합니다. 사람이 읽을 수 있는 콘텐츠는 쿼리 응답 및 동일한 요청에 전체 텍스트 검색 또는 의미 체계 순위를 포함하는 하이브리드 쿼리 에 유용합니다. 채팅 완성 모델을 사용하는 경우 ChatGPT와 같은 대부분의 모델은 사람이 읽을 수 있는 텍스트를 예상하며 원시 벡터를 입력으로 허용하지 않습니다.
벡터 콘텐츠	쿼리 시 사용할 비벡터 콘텐츠의 벡터화된 표현입니다. 벡터는 포함 모델에 의해 생성된 단정밀도 부동 소수점 숫자의 배열입니다. 각 벡터 필드에는 모델 생성 배열이 포함됩니다. 필드당 하나의 포함이 있습니다. 여기서 필드는 최상위 필드(중첩 또는 복합 형식의 일부가 아님)입니다. 간단한 통합을 위해 텍스트 문서의 경우 text-embedding-3 또는 이미지 및 멀티모달 포함에 대한 이미지 검색 REST API와 같은 모델을 Azure OpenAI에 포함하는 것이 좋습니다. 인덱서 및 기술 세트를 사용할 수 있는 경우 인덱싱 중에 이미지와 텍스트를 인코딩하는 통합 벡터화를 고려합니다. 필드 정의는 벡터 필드에 대한 것이지만 들어오는 원본 데이터는 인덱싱 중에 벡터 배열로 변환되는 텍스트 또는 이미지일 수 있습니다.

검색 인덱스는 지원하려는 모든 쿼리 시나리오에 대한 필드와 콘텐츠를 포함해야 합니다. 제품 이름, 버전, 메타데이터 또는 주소를 검색하거나 필터링한다고 가정합니다. 이 경우 벡터 유사성 검색은 특히 유용하지 않습니다. 키워드 검색, 지리 검색 또는 문자 그대로의 콘텐츠를 반복하는 필터가 더 나은 선택이 될 것입니다. 벡터 필드와 비벡터 필드를 모두 포함하는 검색 인덱스로 쿼리 생성 및 응답 컴퍼지션에 대한 최대 유연성을 제공합니다.

벡터 및 비벡터 필드를 포함하는 문서 페이로드의 간단한 예제는 이 문서의 부하 벡터 데이터 섹션을 참조하세요.

기본 인덱스로 시작

벡터 구성 및 벡터 필드를 추가하기 전에 사용할 정의가 있도록 최소 스키마로 시작합니다. 간단한 인덱스가 다음 예제를 참조할 수 있습니다. 인덱스 스키마에 대한 자세한 내용은 검색 인덱스 만들기를 참조하세요.

인덱스에는 필수 이름, 필수 문서 키("key": true) 및 일반 텍스트에서 사람이 읽을 수 있는 콘텐츠에 대한 필드가 있습니다. 벡터화하려는 콘텐츠에 대해 사람이 읽을 수 있는 버전을 사용하는 것이 일반적입니다. 예를 들어 PDF 파일의 텍스트 청크가 있는 경우 인덱스 스키마에는 일반 텍스트 청크의 필드와 벡터화된 청크에 대한 두 번째 필드가 있어야 합니다.

기본 인덱스 "name", "fields" 컬렉션 및 추가 구성을 위한 몇 가지 다른 구문이 있습니다.

POST https://[servicename].search.windows.net/indexes?api-version=[api-version] 
{
  "name": "example-index",
  "fields": [
    { "name": "documentId", "type": "Edm.String", "key": true, "retrievable": true, "searchable": true, "filterable": true },
    { "name": "myHumanReadableNameField", "type": "Edm.String", "retrievable": true, "searchable": true, "filterable": false, "sortable": true, "facetable": false },
    { "name": "myHumanReadableContentField", "type": "Edm.String", "retrievable": true, "searchable": true, "filterable": false, "sortable": false, "facetable": false, "analyzer": "en.microsoft" },
  ],
  "analyzers": [ ],
  "scoringProfiles": [ ],
  "suggesters": [ ],
  "vectorSearch": [ ]
}

벡터 검색 구성 추가

다음으로 스키마에 "vectorSearch" 구성을 추가합니다. 여기서 정의하는 프로필이 벡터 필드 정의의 일부가 되기 때문에 필드 정의 앞에 구성을 지정하는 것이 유용합니다. 스키마에서 벡터 구성은 일반적으로 필드 컬렉션 "analyzers""scoringProfiles""suggesters"뒤에 삽입됩니다. 그러나 순서는 중요하지 않습니다.

벡터 구성에는 다음이 포함됩니다.

vectorSearch.algorithms 는 인덱싱 중에 벡터 노드 간에 "가장 가까운 인접" 정보를 만드는 데 사용됩니다.
vectorSearch.compressions 스칼라 또는 이진 양자화, 오버샘플링 및 원래 벡터로 재정렬.
vectorSearch.profiles 알고리즘 및 압축 구성의 여러 조합을 지정하는 데 사용됩니다.

2024-07-01
2024-05-01-preview

2024-07-01이 일반 공급 버전입니다. 다음과 같은 벡터 구성을 지원합니다.

계층적 탐색 가능한 작은 세계(HNSW) 알고리즘입니다.
전체 KNN(K 가장 인접한 항목) 알고리즘.
스칼라 압축.
이진 압축은 2024-07-01년 및 최신 Azure SDK 패키지에서만 사용할 수 있습니다.
오버샘플링.
원래 벡터로 재정렬합니다.

필드에서 HNSW를 선택하는 경우 쿼리 시간에 포괄적인 KNN을 선택할 수 있습니다. 그러나 그 반대의 경우는 작동하지 않습니다. 인덱싱에 대해 완전하게 선택하는 경우 근사 검색을 사용하도록 설정하는 추가 데이터 구조가 없으므로 나중에 HNSW 검색을 요청할 수 없습니다.

콘텐츠 벡터화 전략이 있어야 합니다. 기본 제공 인코딩의 경우 통합 벡터화와 쿼리 시간 벡터라이저를 권장합니다.

인덱스 만들기 또는 업데이트 REST API를 사용하여 인덱스 만들기
포함 공간을 만드는 데 사용되는 검색 알고리즘을 지정하는 vectorSearch 섹션을 인덱스에 추가합니다.
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         },
         {
             "name": "binary-quantization",
             "kind": "binaryQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-scalar",
         "compression": "scalar-quantization",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
주요 정보:
- 압축, 알고리즘, 프로필의 각 구성에 대한 이름은 인덱스 내에서 해당 형식에 대해 고유해야 합니다.
- vectorSearch.compressions은 scalarQuantization 또는 binaryQuantization가 될 수 있습니다. 스칼라 양자화는 부동 소수 자릿수 값을 더 좁은 데이터 형식으로 압축합니다. 이진 양자화는 부동 소수를 이진 1비트 값으로 변환합니다.
- vectorSearch.compressions.rerankWithOriginalVectors는 원래의 압축되지 않은 벡터를 사용하여 유사성을 다시 계산하고 초기 검색 쿼리에서 반환된 상위 결과의 순위를 다시 지정합니다. 압축되지 않은 벡터는 stored가 false인 경우에도 검색 인덱스에 존재합니다. 이 속성은 선택 사항입니다. 기본값은 true입니다.
- vectorSearch.compressions.defaultOversampling은 양자화로 인한 정보 감소를 상쇄하기 위해 더 광범위한 잠재적 결과 집합을 고려합니다. 잠재적 결과에 대한 수식은 오버샘플링 승수와 함께 쿼리의 k로 구성됩니다. 예를 들어, 쿼리가 k 을 5로 지정하고 오버샘플링이 20인 경우, 쿼리는 원래 압축되지 않은 벡터를 사용하여 재랭크에 사용할 100개의 문서를 효과적으로 요청합니다. 상위 k개의 순위 변경 결과만 반환됩니다. 이 속성은 선택 사항입니다. 기본값은 4입니다.
- vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType는 int8로 설정해야 합니다. 현재 지원되는 유일한 기본 데이터 형식입니다. 이 속성은 선택 사항입니다. 기본값은 int8입니다.
- vectorSearch.algorithms는 hnsw 또는 exhaustiveKnn 둘 중 하나입니다. 인덱싱 중에 벡터 콘텐츠를 구성하는 데 사용되는 가장 가까운 인접 항목(ANN) 알고리즘입니다.
- vectorSearch.algorithms.m은 양방향 링크 수입니다. 기본값은 4입니다. 범위는 4~10입니다. 값이 낮을수록 결과에서 노이즈가 줄어듭니다.
- vectorSearch.algorithms.efConstruction은 인덱싱 중에 사용되는 가장 인접한 항목의 수입니다. 기본값은 400입니다. 범위는 100~1,000입니다.
- "vectorSearch.algorithms.efSearch는 검색 중에 사용되는 가장 인접한 항목의 수입니다. 기본값은 500입니다. 범위는 100~1,000입니다.
- vectorSearch.algorithms.metric는 Azure OpenAI를 사용하는 경우 cosine여야 하며, 그렇지 않으면 사용 중인 포함 모델과 연결된 유사성 메트릭을 사용해야 합니다. 지원되는 값은 cosine, dotProduct, euclidean, 및 hamming이며 이진 데이터 인덱싱에 사용됩니다.
- vectorSearch.profiles는 더 풍부한 정의를 수용하는 추상화 계층을 추가합니다. 프로필은 vectorSearch에서 정의되고 각 벡터 필드에서 이름으로 참조됩니다. 이는 압축과 알고리즘 구성의 조합입니다. 이 속성을 벡터 필드에 할당하면 필드의 알고리즘과 압축이 결정됩니다.

2024-05-01-preview는 최신 미리 보기 버전입니다. 이전 미리 보기 버전을 포함합니다.

미리 보기 및 안정적인 API 버전은 동일한 vectorSearch 구성을 지원합니다. 안정적인 버전보다 미리보기를 선택하는 이유는 쿼리 시간에 호출되는 더 많은 압축 옵션 또는 최신 벡터라이저와 같은 다양한 가능성 때문입니다.

인덱스 만들기 또는 업데이트 미리 보기 REST API를 사용하여 인덱스를 만듭니다.
포함 공간을 만드는 데 사용되는 압축 설정과 검색 알고리즘을 지정하는 vectorSearch 섹션을 인덱스에 추가합니다. 자세한 내용은 벡터 양자화 구성을 참조 하세요.
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "my-scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-1",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
주요 정보:
- vectorSearch.compressions.kind는 scalarQuantization이어야 합니다.
- vectorSearch.compressions.rerankWithOriginalVectors는 원래의 압축되지 않은 벡터를 사용하여 유사성을 다시 계산하고 초기 검색 쿼리에서 반환된 상위 결과의 순위를 다시 지정합니다. 압축되지 않은 벡터는 stored가 false인 경우에도 검색 인덱스에 존재합니다. 이 속성은 선택 사항입니다. 기본값은 true입니다.
- vectorSearch.compressions.defaultOversampling은 양자화로 인한 정보 감소를 상쇄하기 위해 더 광범위한 잠재적 결과 집합을 고려합니다. 잠재적 결과에 대한 수식은 오버샘플링 승수와 함께 쿼리의 k로 구성됩니다. 예를 들어 쿼리가 k을(를) 5로 지정하고 오버샘플링이 20인 경우, 쿼리는 원래 압축되지 않은 벡터를 사용하여 재정렬에 사용할 100개의 문서를 효과적으로 요청합니다. 상위 k개의 순위 변경 결과만 반환됩니다. 이 속성은 선택 사항입니다. 기본값은 4입니다.
- vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType는 int8로 설정해야 합니다. 현재 지원되는 유일한 기본 데이터 형식입니다. 이 속성은 선택 사항입니다. 기본값은 int8입니다.
- vectorSearch.algorithms.kind는 hnsw 또는 exhaustiveKnn 둘 중 하나입니다. 인덱싱 중에 벡터 콘텐츠를 구성하는 데 사용되는 가장 가까운 인접 항목(ANN) 알고리즘입니다.
- vectorSearch.algorithms.m은 양방향 링크 수입니다. 기본값은 4입니다. 범위는 4~10입니다. 값이 낮을수록 결과에서 노이즈가 줄어듭니다.
- vectorSearch.algorithms.efConstruction은 인덱싱 중에 사용되는 가장 인접한 항목의 수입니다. 기본값은 400입니다. 범위는 100~1,000입니다.
- vectorSearch.algorithms.efSearch는 검색 중에 사용되는 가장 인접한 항목의 수입니다. 기본값은 500입니다. 범위는 100~1,000입니다.
- Azure OpenAI를 사용하는 경우에는 vectorSearch.algorithms.metric가 cosine이어야 하며, 그렇지 않으면 사용 중인 포함 모델과 연결된 유사성 메트릭을 사용하십시오. 지원되는 값은 cosine, dotProduct, euclidean, 및 hamming이며, 이는 이진 데이터 인덱싱에 사용됩니다.
- vectorSearch.profiles는 더 풍부한 정의를 수용하는 추상화 계층을 추가합니다. 프로필은 vectorSearch에 정의되고 각 벡터 필드에서는 이름으로 참조됩니다. 이는 압축과 알고리즘 구성의 조합입니다. 이 속성을 벡터 필드에 할당하면 필드의 알고리즘과 압축이 결정됩니다.

새로운 미리 보기 기능에 대한 자세한 내용은 Azure AI 검색의 새로운 기능을 참조하세요.

필드 컬렉션에 벡터 필드 추가

벡터 구성이 있으면 필드 컬렉션에 벡터 필드를 추가할 수 있습니다. 필드 컬렉션에는 RAG 워크로드에서 하이브리드 검색 시나리오 또는 채팅 모델 완성에 필요한 문서 키, 벡터 필드 및 기타 비벡터 필드의 필드가 포함되어야 합니다.

벡터 필드는 데이터 형식, dimensions 벡터를 출력하는 데 사용되는 포함 모델을 기반으로 하는 속성 및 이전 단계에서 만든 벡터 프로필을 특징으로 합니다.

2024-07-01
2024-05-01-preview

2024-07-01이 일반 공급 버전입니다.

인덱스 만들기 또는 업데이트 REST API를 사용하여 인덱스 만들기 및 필드 컬렉션에 벡터 필드를 추가합니다.

{
  "name": "example-index",
  "fields": [
    {
        "name": "contentVector",
        "type": "Collection(Edm.Single)",
        "searchable": true,
        "retrievable": false,
        "stored": false,
        "dimensions": 1536,
        "vectorSearchProfile": "vector-profile-1"
    }
  ]
}

다음 특성을 사용하여 벡터 필드를 지정합니다. 필드당 하나의 생성된 포함을 저장할 수 있습니다. 각 벡터 필드는 다음과 같습니다.
- type 는 벡터 데이터 형식이어야 합니다. Collection(Edm.Single)은 모델을 포함하는 데 가장 일반적입니다.
- dimensions는 포함 모델에서 생성된 차원의 수입니다. text-embedding-ada-002의 경우 1536으로 고정됩니다. text-embedding-3 모델 계열의 경우 값 범위가 있습니다. 통합 벡터화 및 포함 기술을 사용하여 벡터를 생성하는 경우 이 속성이 포함 기술에 사용되는 것과 동일한 차원 값으로 설정되어 있는지 확인합니다.
- vectorSearchProfile은 인덱스의 다른 위치에 정의된 프로필의 이름입니다.
- searchable은 true여야 합니다.
- retrievable은 true 또는 false일 수 있습니다. True는 원시 벡터(그 중 1,536개)를 일반 텍스트로 반환하고 스토리지 공간을 사용합니다. 벡터 결과를 다운스트림 앱에 전달하는 경우 true로 설정합니다.
- stored은 true 또는 false일 수 있습니다. 벡터의 추가 복사본을 검색용으로 저장할지 여부를 결정합니다. 자세한 내용은 벡터 크기 줄이기를 참조하세요.
- filterable, facetable, 및 sortable는 false여야 합니다.
벡터 쿼리에서 사전 필터링 또는 사후 필터링을 수행하려는 경우, filterable를 true로 설정하여 title와 같은 필터링 가능한 비벡터 필드를 컬렉션에 추가합니다.

인덱싱하는 텍스트 콘텐츠의 내용과 구조를 정의하는 다른 필드를 추가합니다. 최소한 문서 키가 필요합니다.

쿼리 또는 응답에 유용한 필드도 추가해야 합니다. 다음 예제에서는 벡터와 동일한 제목 및 콘텐츠(titleVector 및 contentVector)에 대한 벡터 필드를 보여 줍니다. 또한 검색 결과에서 정렬, 필터링 및 읽기에 유용한 동일한 텍스트 콘텐츠(title 및 content)에 대한 필드도 제공합니다.

다음 예제에서는 필드 컬렉션을 보여줍니다.

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-07-01&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "title",
            "type": "Edm.String",
            "searchable": true,
            "filterable": true,
            "sortable": true,
            "retrievable": true
        },
        {
            "name": "titleVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": true,
            "stored": true,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "content",
            "type": "Edm.String",
            "searchable": true,
            "retrievable": true
        },
        {
            "name": "contentVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

2024-05-01-preview는 최신 미리 보기 버전입니다. 모든 벡터 데이터 형식에 대한 지원을 포함하여 안정적인 버전과 동일한 벡터 필드 정의를 지원합니다.

인덱스 만들기 또는 업데이트 미리 보기 REST API를 사용하여 인덱스 만들기 및 필드 컬렉션에 벡터 필드를 추가합니다.

{
  "name": "example-index",
  "fields": [
    {
        "name": "contentVector",
        "type": "Collection(Edm.Single)",
        "searchable": true,
        "retrievable": false,
        "stored": false,
        "dimensions": 1536,
        "vectorSearchProfile": "vector-profile-1"
    }
  ]
}

다음 특성을 사용하여 벡터 필드를 지정합니다. 문서 필드당 하나의 생성된 포함을 저장할 수 있습니다. 각 벡터 필드는 다음과 같습니다.
- type은 Collection(Edm.Single), Collection(Edm.Half), Collection(Edm.Int16) 또는 Collection(Edm.SByte)일 수 있습니다.
- dimensions는 포함 모델에서 생성된 차원의 수입니다. text-embedding-ada-002의 경우 1536입니다.
- vectorSearchProfile은 인덱스의 다른 위치에 정의된 프로필의 이름입니다.
- searchable은 true여야 합니다.
- retrievable은 true 또는 false일 수 있습니다. True는 원시 벡터(그 중 1,536개)를 일반 텍스트로 반환하고 스토리지 공간을 사용합니다. 벡터 결과를 다운스트림 앱에 전달하는 경우 true로 설정합니다. stored가 false일 경우에 false 값이 필요합니다.
- stored는 벡터 필드에만 적용되는 새로운 부울 속성입니다. True는 검색 결과에 반환된 벡터의 복사본을 저장합니다. False는 인덱싱 중에 해당 복사본을 취소합니다. 벡터에서 검색할 수 있지만 결과에는 벡터를 반환할 수 없습니다.
- filterable, facetable, 및 sortable는 모두 false 여야 합니다.
filterable에서 사전 필터링 또는 사후 필터링을 호출하려면 이 true로 설정된 "title"과 같은 필터링 가능한 비 벡터 필드를 컬렉션에 추가합니다.

인덱싱하는 텍스트 콘텐츠의 내용과 구조를 정의하는 다른 필드를 추가합니다. 최소한 문서 키가 필요합니다.

다음 예제에서는 필드 컬렉션을 보여줍니다.

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-05-01-preview&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "firstVectorfield-float32-embeddings",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "secondVectorfield-float16-embeddings",
            "type": "Collection(Edm.Half)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "thirdVectorfield-int8-embeddings-for-my-custom-quantization-output",
            "type": "Collection(Edm.SByte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "fourthVectorfield-for-binary-data",
            "type": "Collection(Edm.Byte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

인덱싱을 위한 벡터 데이터 로드

인덱싱을 위해 제공하는 콘텐츠는 인덱스 스키마를 준수해야 하며 문서 키에 대한 고유한 문자열 값을 포함해야 합니다. 사전 벡터화된 데이터는 하나 이상의 벡터 필드에 로드되며, 이는 비벡터 콘텐츠를 포함하는 다른 필드와 공존할 수 있습니다.

데이터 수집의 경우 밀어넣기 또는 끌어오기 방법론을 사용할 수 있습니다.

푸시 API
끌어오기 API(인덱서)

벡터 및 벡터가 아닌 데이터를 인덱스에 로드하려면 문서 - 인덱스를 사용합니다. 인덱싱을 위한 푸시 API는 모든 안정 버전과 미리 보기 버전에서 동일합니다. 문서를 로드하려면 다음 API 중 하나를 사용합니다.

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/index?api-version=2024-07-01

{
    "value": [
        {
            "id": "1",
            "title": "Azure App Service",
            "content": "Azure App Service is a fully managed platform for building, deploying, and scaling web apps. You can host web apps, mobile app backends, and RESTful APIs. It supports a variety of programming languages and frameworks, such as .NET, Java, Node.js, Python, and PHP. The service offers built-in auto-scaling and load balancing capabilities. It also provides integration with other Azure services, such as Azure DevOps, GitHub, and Bitbucket.",
            "category": "Web",
            "titleVector": [
                -0.02250031754374504,
                 . . . 
                        ],
            "contentVector": [
                -0.024740582332015038,
                 . . .
            ],
            "@search.action": "upload"
        },
        {
            "id": "2",
            "title": "Azure Functions",
            "content": "Azure Functions is a serverless compute service that enables you to run code on-demand without having to manage infrastructure. It allows you to build and deploy event-driven applications that automatically scale with your workload. Functions support various languages, including C#, F#, Node.js, Python, and Java. It offers a variety of triggers and bindings to integrate with other Azure services and external services. You only pay for the compute time you consume.",
            "category": "Compute",
            "titleVector": [
                -0.020159931853413582,
                . . .
            ],
            "contentVector": [
                -0.02780858241021633,
                 . . .
            ],
            "@search.action": "upload"
        }
        . . .
    ]
}

끌어오기 API는 데이터 검색 및 새로 고침에서 벡터 검색을 위한 콘텐츠를 인코딩하는 통합 벡터화에 이르기까지 여러 인덱싱 단계를 자동화하는 인덱서를 참조합니다.

데이터 원본은 지원되는 형식이어야 합니다.
기술 세트는 데이터 청크 처리를 위한 텍스트 분할 기술과 임베딩 모델에 연결하는 기술을 제공합니다. 일부 기술은 일반적으로 사용할 수 있지만 다른 기술은 아직 미리 보기로 제공됩니다. 기술과 벡터화 도구를 사용하여 임베딩을 생성합니다. 인덱싱을 위해 선택한 기술은 쿼리에 대한 동등한 벡터라이저와 함께 사용되어야 합니다. 인덱싱 중 벡터화를 위해 다음 기술 중에서 선택합니다.
인덱스는 벡터 필드 정의와 벡터 검색 구성을 제공합니다. 이 문서에서는 이러한 정의에 대해 설명합니다.
인덱서는 인덱싱 파이프라인을 구동합니다. 자세한 내용은 인덱서 만들기를 참조하세요.

인덱서와 스킬셋에 익숙한 경우:

필드 매핑, 출력 필드 매핑 및 삭제 검색 설정은 벡터 필드와 벡터가 아닌 필드에 동일하게 적용됩니다.
벡터 데이터가 파일에서 제공되는 경우, 데이터 모양에 따라 json, jsonLines, 또는 csv 같은 기본이 아닌 parsingMode를 사용하는 것이 좋습니다.
데이터 원본의 경우 앞서 언급한 구문 분석 모드 중 하나를 사용하는 Azure Blob 인덱서 및 Azure Cosmos DB for NoSQL 인덱서가 테스트를 거쳐 작동하는 것으로 확인되었습니다.
데이터 원본의 모든 벡터 차원은 동일해야 하며 매핑되는 필드에 대한 인덱스 정의와 일치해야 합니다. 인덱서는 일치하지 않는 문서에 대해 오류를 발생시킵니다.

인덱스에서 벡터 콘텐츠를 조회하십시오.

유효성 검사를 위해 Azure Portal의 검색 탐색기 또는 REST API 호출을 사용하여 인덱스를 쿼리할 수 있습니다. Azure AI 검색은 벡터를 사람이 읽을 수 있는 텍스트로 변환할 수 없으므로, 동일한 문서에서 일치성을 보여주는 필드를 반환하도록 시도하십시오. 예를 들어, 벡터 쿼리가 titleVector 필드를 대상으로 하는 경우, title를 검색 결과로 선택할 수 있습니다.

필드는 결과에 포함되도록 특성 retrievable 이 지정되어야 합니다.

Azure Portal
REST API

검색 관리>인덱스에서 인덱스를 검토하여 전체 인덱스 크기와 벡터 인덱스 크기를 확인합니다. 양의 벡터 인덱스 크기는 벡터가 존재함을 나타냅니다.
검색 탐색기를 사용하여 인덱스를 쿼리합니다. 검색 탐색기에는 쿼리 보기(기본값)와 JSON 보기의 두 가지 보기가 있습니다.
- 더 읽기 쉬운 결과를 얻으려면 쿼리 옵션>검색 결과에서 벡터 값 숨기기를 설정합니다.
- 벡터 쿼리에 JSON 뷰를 사용합니다. 실행하려는 벡터 쿼리의 JSON 정의를 붙여넣을 수 있습니다. 인덱스가 벡터라이저 할당이 있는 경우 기본 제공 텍스트-벡터 또는 이미지-벡터 변환을 사용할 수도 있습니다. 이미지 검색에 대한 자세한 내용은 빠른 시작: 검색 탐색기에서 이미지 검색을 참조하세요.
- 인덱스에 벡터가 포함되어 있는지 빠르게 확인하려면 기본 쿼리 보기를 사용합니다. 쿼리 뷰는 전체 텍스트 검색을 위한 것입니다. 벡터 쿼리에는 사용할 수 없지만 빈 검색(search=*)을 보내 콘텐츠를 확인할 수 있습니다. 벡터 필드를 포함한 모든 필드의 콘텐츠는 일반 텍스트로 반환됩니다.

자세한 내용은 벡터 쿼리 만들기를 참조하세요.

다음 REST API 예제는 벡터 쿼리이지만 비벡터 필드(title및contentcategory)만 반환합니다. 표시된 retrievable 필드만 검색 결과에 반환할 수 있습니다.

POST https://my-search-service.search.windows.net/indexes/my-index/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            . . . 
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 5
    },
    "select": "title, content, category"
}

벡터 인덱스 업데이트

벡터 인덱스를 업데이트하려면 스키마를 수정하고 문서를 다시 로드하여 새 필드를 채웁다. 스키마 업데이트용 API에는 인덱스 만들기 또는 업데이트(REST), .NET용 Azure SDK의 CreateOrUpdateIndex, Python용 Azure SDK의 create_or_update_index 및 다른 Azure SDK의 유사한 메서드가 포함됩니다.

인덱스 업데이트에 대한 표준 지침은 인덱 스 업데이트 또는 다시 작성을 참조하세요.

주요 사항은 다음과 같습니다.

기존 필드를 업데이트하고 삭제하려면 드롭 및 전체 인덱스 다시 작성이 필요한 경우가 많습니다.
다시 빌드 요구 사항 없이 다음을 수정할 수 있습니다.
- 필드 컬렉션에 새 필드를 추가합니다.
- 새 필드에 할당되었지만 이미 벡터화된 기존 필드에는 할당되지 않은 새 벡터 구성을 추가합니다.
- 기존 필드에서 retrievable을/를 변경합니다 (값은 true 또는 false로 설정할 수 있습니다). 벡터 필드는 검색 및 조회가 가능해야 하지만 삭제 및 다시 빌드가 불가능한 상황에서 벡터 필드에 대한 액세스를 사용하지 않도록 설정하려면 조회 가능 항목을 false로 설정하면 됩니다.

다음 단계

다음 단계로 벡터 쿼리를 만드는 것이 좋습니다.

azure-search-vector-samples 리포지토리의 코드 샘플에서는 스키마 정의, 벡터화, 인덱싱 및 쿼리를 포함하는 엔드투엔드 워크플로를 보여 줍니다.

Python, C# 및 JavaScript에 대한 데모 코드가 있습니다.