Azure AI Search에서 전체 텍스트 쿼리 만들기

전체 텍스트 검색용 쿼리를 작성하는 경우, 이 문서에서는 요청 설정 단계를 안내합니다. 또한 쿼리 구조를 소개하고, 필드 속성과 언어 분석기가 쿼리 결과에 미치는 영향을 설명합니다.

필수 구성 요소

Azure AI Search 서비스 (모든 수준). 서비스 만들기 또는 기존의 것을 찾기.
검색 인덱스로, 문자열 필드가 검색 가능으로 지정되어 있습니다. 인덱스 별칭을 쿼리 요청의 엔드포인트로 사용할 수도 있습니다.
인덱스를 쿼리할 수 있는 권한:
- 키 기반 인증: 검색 서비스용 쿼리 API 키.
- 역할 기반 인증: 검색 인덱스 데이터 판독기 역할
SDK 개발의 경우 Azure Search 클라이언트 라이브러리를 설치합니다.
- Python: azure-search-documents
- .NET: Azure. Search.Documents
- JavaScript: @azure/search-documents
- Java: azure-search-documents

팁 (조언)

빠른 코드 예제의 경우 전체 텍스트 쿼리 요청의 예제로 건너뜁니다.

전체 텍스트 쿼리 요청 예시

Azure AI Search 쿼리는 단일 검색 인덱스의 docs 컬렉션에 대한 읽기 전용 요청으로, 쿼리 실행을 알리고 다시 들어오는 응답을 셰이프하는 매개 변수가 있습니다.

전체 텍스트 쿼리는 search 매개변수에 지정되며, 용어, 따옴표로 묶인 구문, 연산자로 구성됩니다. 그 외 매개변수는 요청에 대한 추가 정의를 제공합니다.

다음 Search POST REST API 호출은 search 및 기타 매개 변수를 사용한 쿼리 요청을 설명합니다.

POST https://[service name].search.windows.net/indexes/hotels-sample/docs/search?api-version=2025-09-01
{
    "search": "NY +view",
    "queryType": "simple",
    "searchMode": "all",
    "searchFields": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "select": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "top": 10,
    "count": true
}

참조:POST 검색

핵심 내용

search은 일치 기준을 제공하며, 일반적으로 연산자 포함 여부와 상관없이 전체 용어나 구문으로 구성됩니다. 인덱스 스키마에서 검색 가능 으로 특성이 지정된 모든 필드는 검색 작업의 범위 내에 있습니다.
queryType은 파서를 설정하며, 단순, 전체 중 하나를 선택합니다. 기본 단순 쿼리 파서는 전체 텍스트 검색에 최적화되어 있습니다. 전체 Lucene 쿼리 파서는 정규식, 근접 검색, 퍼지 검색, 와일드카드 검색과 같은 고급 쿼리 구문에 사용됩니다. 이 매개 변수는 쿼리 응답에서 고급 의미 체계 모델링의 의미 체계 순위에 대한 의미체계로 설정할 수도 있습니다.
searchMode 는 일치 항목이 식의 모든 조건(정밀도 선호) 또는 조건 (재현율 선호)을 기반으로 하는지 여부를 지정합니다. 기본값은 any입니다. 큰 텍스트 블록(내용 필드 또는 긴 설명)이 포함된 인덱스에서 부울 연산자를 많이 사용할 것으로 예상되는 경우 searchMode=Any|All 매개 변수로 쿼리를 테스트하여 해당 설정이 부울 검색에 미치는 영향을 평가해야 합니다.
searchFields은 쿼리 실행을 검색 가능한 특정 필드로 제한합니다. 개발하는 동안 선택 및 검색에 동일한 필드 목록을 사용하는 것이 좋습니다. 그렇지 않으면, 결과에서 확인할 수 없는 필드 값에 기반하여 일치가 이루어질 수 있어 문서가 반환된 이유가 불확실해질 수 있습니다.

응답을 형성하는 데 사용되는 매개 변수는 다음과 같습니다.

select는 응답에 반환할 필드를 지정합니다. 인덱스로 검색 가능한 것으로 표시된 필드만 select 문에서 사용할 수 있습니다.
top은 지정된 수의 가장 일치하는 문서를 반환합니다. 이 예제에서는 10개의 적중 사항만 반환됩니다. top과 skip(표시되지 않음)을 사용하여 결과를 페이징할 수 있습니다.
count는 전체 인덱스에서 전반적으로 일치하는 문서의 개수를 알려 줍니다. 이는 반환되는 것보다 많을 수 있습니다. 유효한 값은 "true" 또는 "false"입니다. 기본값은 "false"입니다. 인덱스가 안정적인 경우 개수는 정확합니다. 하지만 문서가 적극적으로 추가, 업데이트 또는 삭제되는 경우에는 그 수가 과소 또는 과대 보고될 수 있습니다. 문서 없이 개수만 얻으려면 $top=0을 사용할 수 있습니다.
orderby는 등급 또는 위치와 같은 값을 기준으로 결과를 정렬하려는 경우에 사용됩니다. 그렇지 않으면 기본값은 관련성 점수를 사용하여 결과의 순위를 지정하는 것입니다. 이 매개 변수의 후보가 되려면 필드가 정렬 가능한 상태로 지정되어야 합니다.

클라이언트 선택

초기 개발 및 개념 증명 테스트를 위해 Azure portal 또는 REST 클라이언트 또는 Jupyter notebook 시작합니다. 이러한 방법은 대화형이며, 대상 테스트에 유용하며 코드를 작성하지 않고도 다양한 속성의 효과를 평가하는 데 도움이 됩니다.

앱 내에서 검색을 호출하려면 .NET, Java, JavaScript 및 Python용 Azure SDK의 Azure.Document.Search 클라이언트 라이브러리를 사용합니다.

Azure 포털에서 인덱스를 열 때, 필드 특성에 쉽게 접근할 수 있도록 나란히 표시되는 탭에서 인덱스 JSON 정의와 함께 검색 탐색기를 사용할 수 있습니다. 쿼리를 테스트하는 동안 검색 가능, 정렬 가능, 필터링 가능 및 패싯 가능 필드를 보려면 필드 표를 확인합니다.

Azure Portal에서 검색 서비스로 이동합니다.
서비스에서 인덱스를 선택하고 인덱스를 선택합니다.
즉시 쿼리할 수 있도록 인덱스가 검색 탐색기 탭에 열립니다. 쿼리 구문을 지정하려면 JSON 보기로 전환합니다.

호텔 샘플 인덱스용으로 작동하는 전체 텍스트 검색 쿼리 식은 다음과 같습니다.
```
   {
       "search": "pool spa +airport",
       "queryType": "simple",
       "searchMode": "any",
       "searchFields": "Description, Tags",
       "select": "HotelName, Description, Tags",
       "top": 10,
       "count": true
   }
```
참조:POST 검색

다음 스크린샷은 쿼리와 응답을 보여 줍니다.

GET을 사용하여 호출할 때 요청 URL의 길이는 8KB를 초과할 수 없습니다. 이 길이는 대부분의 애플리케이션에 충분합니다. 그러나 일부 애플리케이션은 특히 OData 필터 식이 사용되는 경우 큰 쿼리를 생성합니다. 이러한 애플리케이션의 경우 HTTP POST는 GET보다 더 큰 필터를 허용하므로 더 나은 선택입니다.

POST를 사용하면 POST에 대한 요청 크기 제한이 약 16MB이므로 필터의 절 수는 원시 필터 문자열의 크기가 아니라 제한 요소입니다. POST 요청 크기 제한이 크더라도 필터 식은 임의로 복잡할 수 없습니다. 필터 복잡성 제한에 대한 자세한 내용은 OData 식 구문을 참조하세요.

REST 클라이언트를 사용하여 요청을 설정합니다. 처음 시작하는 데 도움이 필요하면 Quickstart: REST를 사용한 전체 텍스트 검색을 참조하세요.

다음 예에서는 전체 텍스트 검색을 위해 REST API를 호출합니다.

POST https://[service name].search.windows.net/indexes/hotels-sample/docs/search?api-version=2025-09-01
{
    "search": "NY +view",
    "queryType": "simple",
    "searchMode": "all",
    "searchFields": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "select": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "count": true
}

참조:POST 검색

부분 검색 응답의 연속

경우에 따라 Azure AI Search 요청된 모든 결과를 단일 검색 응답으로 반환할 수 없습니다. 쿼리가 $top 지정하지 않거나 너무 큰 $top 값을 지정하여 너무 많은 문서를 반환하는 경우와 같은 여러 가지 이유로 부분 응답이 발생할 수 있습니다. 이러한 경우 Azure AI Search 응답 본문에 @odata.nextLink 주석을 포함하고 POST 요청인 경우 @search.nextPageParameters 포함합니다. 이러한 주석의 값을 사용하여 다른 검색 요청을 작성하여 검색 응답의 다음 부분을 가져올 수 있습니다. 이 동작을 원래 검색 요청의 연속 이라고 하며 주석을 연속 토큰이라고 합니다. 이러한 주석의 구문과 응답 본문에 표시되는 위치에 대한 자세한 내용은 응답 섹션의 예제를 참조하세요.

Azure AI Search 연속 토큰을 반환하는 이유는 구현에 따라 달라지고 변경될 수 있습니다. 강력한 클라이언트는 항상 예상보다 적은 수의 문서가 반환되고 연속 토큰이 포함된 경우를 처리하여 문서를 계속 검색할 준비가 되어 있어야 합니다. 또한 계속하려면 원래 요청과 동일한 HTTP 메서드를 사용해야 합니다. 예를 들어 GET 요청을 보낸 경우 보내는 모든 연속 요청도 GET(POST와 마찬가지로)을 사용해야 합니다.

비고

페이징에 대한 일반적인 메커니즘을 제공하지 않는 @odata.nextLink와 @search.nextPageParameters의 목적은 많은 결과를 요청하는 쿼리로부터 서비스를 보호하는 것입니다. 결과를 페이지별로 탐색하려면 $top과 $skip을 같이 사용하세요. 예를 들어 크기가 10인 페이지를 원하는 경우 첫 번째 요청에는 $top=10 및 $skip=0이 있어야 하며, 두 번째 요청은 $top=10이고 $skip=10이어야 하며, 세 번째 요청에는 $top=10, $skip=20이 있어야 합니다.

다음 예제에서는 Azure SDK를 사용하여 전체 텍스트 쿼리를 실행하는 방법을 보여 줍니다.

Python

from azure.core.credentials import AzureKeyCredential
from azure.search.documents import SearchClient

# Set up the client
service_name = "<your-search-service-name>"
index_name = "hotels-sample"
api_key = "<your-query-api-key>"

endpoint = f"https://{service_name}.search.windows.net"
credential = AzureKeyCredential(api_key)
client = SearchClient(endpoint=endpoint, index_name=index_name, credential=credential)

# Run a full-text search query
results = client.search(
    search_text="NY +view",
    search_mode="all",
    search_fields=["HotelName", "Description", "Address/City", "Tags"],
    select=["HotelName", "Description", "Address/City", "Tags"],
    top=10,
    include_total_count=True
)

print(f"Total documents matching query: {results.get_count()}")
for result in results:
    print(f"Hotel: {result['HotelName']}")

참조:SearchClient, 검색

C#

using Azure;
using Azure.Search.Documents;
using Azure.Search.Documents.Models;

// Set up the client
string serviceName = "<your-search-service-name>";
string indexName = "hotels-sample";
string apiKey = "<your-query-api-key>";

Uri endpoint = new Uri($"https://{serviceName}.search.windows.net");
AzureKeyCredential credential = new AzureKeyCredential(apiKey);
SearchClient searchClient = new SearchClient(endpoint, indexName, credential);

// Run a full-text search query
SearchOptions options = new SearchOptions
{
    SearchMode = SearchMode.All,
    IncludeTotalCount = true,
    Size = 10
};
options.SearchFields.Add("HotelName");
options.SearchFields.Add("Description");
options.Select.Add("HotelName");
options.Select.Add("Description");

SearchResults<SearchDocument> response = await searchClient.SearchAsync<SearchDocument>("NY +view", options);

Console.WriteLine($"Total documents matching query: {response.TotalCount}");
await foreach (SearchResult<SearchDocument> result in response.GetResultsAsync())
{
    Console.WriteLine($"Hotel: {result.Document["HotelName"]}");
}

참조:SearchClient, SearchAsync, SearchOptions

추가 SDK 리소스

Azure SDK	클라이언트	예제
.NET	SearchClient	DotNetHowTo
Java	SearchClient	SearchForDynamicDocumentsExample.java
JavaScript	SearchClient	SDK 예제
Python	SearchClient	sample_simple_query.py

쿼리 형식 선택: 기본 | 전체

쿼리가 전체 텍스트 검색인 경우, 쿼리 파서는 검색어와 구문으로 전달된 모든 텍스트를 처리하는 데 사용됩니다. Azure AI Search 두 개의 쿼리 파서를 제공합니다.

단순 파서는 간단한 쿼리 구문을 이해합니다. 이 파서는 자유 형식 텍스트 쿼리에서 속도와 효율성의 기본값으로 선택됩니다. 이 구문은 용어 및 구문 검색을 위한 일반 검색 연산자(AND, OR, NOT)와 접두사(*) 검색(예: sea*에서 Seattle과 Seaside)을 지원합니다. 일반적인 권장 사항은 간단한 파서를 먼저 시도한 후 애플리케이션 요구 사항에 따라 더 강력한 쿼리가 필요한 경우 전체 파서로 이동하는 것입니다.
전체 Lucene 쿼리 구문은 요청에 queryType=full을 추가하면 활성화되며, Apache Lucene 파서를 기반으로 합니다.

전체 구문과 단순 구문은 접두사 및 불리언 연산을 모두 지원한다는 점에서 겹치지만, 전체 구문은 더 많은 연산자를 제공합니다. 전체 구문에서는 불리언 표현식에 대한 더 많은 연산자와 퍼지 검색, 와일드카드 검색, 근접 검색, 정규식과 같은 고급 쿼리를 위한 더 많은 연산자가 제공됩니다.

쿼리 메서드 선택

검색은 근본적으로 사용자가 주도하는 작업으로, 검색어 또는 구문이 검색 상자에서 수집되거나 페이지의 클릭 이벤트를 통해 수집됩니다. 다음 표는 사용자 입력을 수집할 수 있는 메커니즘과 예상되는 검색 경험을 요약한 것입니다.

입력	환경
메서드 검색	사용자는 용어 또는 구를 연산자 유의 여부에 관계없이 검색 상자에 입력하고 검색을 선택하여 요청을 보냅니다. 검색은 동일한 요청에 대해 필터와 함께 사용할 수 있지만 자동 완성이나 제안 사항과는 함께 사용할 수 없습니다.
자동 완성 메서드	사용자가 몇 글자를 입력하면, 각 글자가 입력될 때마다 쿼리가 실행됩니다. 응답은 인덱스에서 완성된 문자열입니다. 제공된 문자열이 유효한 경우 사용자는 검색을 선택하여 해당 쿼리를 서비스로 보냅니다.
Suggestions 메서드	Autocomplete 메서드와 마찬가지로 사용자가 몇 개의 문자를 입력하면 증분 쿼리가 생성됩니다. 응답은 일반적으로 고유하거나 설명 필드로 표시되는 일치하는 문서의 드롭다운 목록입니다. 선택 영역 중 하나가 유효한 경우 사용자는 하나를 선택하고 일치하는 문서가 반환됩니다.
패싯 탐색	페이지에는 클릭 가능한 탐색링크나 검색 범위를 좁히는 이동 경로가 표시됩니다. 패싯 탐색구조는 초기 쿼리를 기반으로 하여 동적으로 구성됩니다. 예를 들어 `search=*`를 사용하여 가능한 모든 범주로 구성된 패싯 탐색 트리를 채울 수 있습니다. 패싯 탐색 구조는 쿼리 응답에서 생성되지만 다음 쿼리를 표현하는 메커니즘이기도 합니다. REST API 참조에서 `facets`은 문서 검색 작업의 쿼리 매개 변수로 설명되지만 `search` 매개 변수 없이 사용할 수 있습니다.
필터 메서드	필터는 패싯에서 결과의 범위를 좁히는 데 사용됩니다. 페이지 이면의 필터를 구현할 수도 있습니다. 예를 들어 언어별 필드를 사용하면 페이지를 초기화할 수 있습니다. REST API 참조에서 `$filter`은 문서 검색 작업의 쿼리 매개 변수로 설명되지만 `search` 매개 변수 없이 사용할 수 있습니다.

쿼리에 대한 필드 특성의 효과

쿼리 유형과 컴퍼지션에 대해 잘 알고 있는 경우 쿼리 요청의 매개 변수는 인덱스의 필드 특성에 따라 달라집니다. 예를 들어 검색 가능 및 조회 가능으로 표시된 필드만 쿼리 및 검색 결과에 사용할 수 있습니다. 요청에서 search, filter 및 orderby 매개 변수를 설정할 때 예기치 않은 결과를 방지하기 위해 특성을 확인해야 합니다.

호텔 샘플 인덱스의 다음 스크린샷에서는 LastRenovationDate 및 Rating의 마지막 두 필드만 정렬할 수 있으며 유일한 "$orderby" 절에서 사용하기 위한 요구 사항입니다.

필드 특성 정의는 인덱스 만들기(REST API)를 참조하세요.

토큰이 쿼리에 미치는 영향

인덱싱하는 동안 검색 엔진은 문자열에 텍스트 분석기를 사용하여 쿼리 시 일치 항목을 찾을 가능성을 최대화합니다. 최소한 소문자 문자열이지만 분석기에 따라 분류 정리 및 중지 단어 제거를 수행할 수도 있습니다. 일반적으로 큰 문자열이나 복합 단어는 공백, 하이픈 또는 대시로 구분되며 별도의 토큰으로 인덱싱됩니다.

핵심은 인덱스에 포함된 내용과 인덱스에 실제로 포함된 내용이 다를 수 있다는 것입니다. 쿼리에서 예상된 결과가 반환되지 않는 경우 텍스트 분석(REST API)을 통해 분석기에서 생성한 토큰을 검사할 수 있습니다. 토큰화와 쿼리에 미치는 영향에 대한 자세한 내용은 부분 용어 검색 및 특수 문자가 포함된 패턴을 참조하세요.

쿼리 문제 해결

다음 표에는 일반적인 쿼리 문제 및 해결 방법이 나와 있습니다.

문제	원인	해결 방법
빈 결과	쿼리 용어와 일치하는 문서가 없습니다.	필드가 스키마에서 검색 가능한 것으로 표시되어 있는지 확인합니다. 텍스트 분석 API를 사용하여 토큰화를 확인합니다.
예기치 않은 결과	쿼리는 의도하지 않은 필드와 일치합니다.	검색되는 필드를 제한하는 데 사용합니다 `searchFields` .
너무 많은 결과	쿼리가 너무 광범위합니다.	연산자를 사용하여 필터를 추가하거나 `searchMode=all`를 사용하거나, `+` 연산자로 필요한 용어를 추가합니다.
결과가 예상대로 순위가 지정되지 않음	관련성 점수는 예상과 일치하지 않습니다.	점수 매기기 프로필 또는 의미 체계 순위를 고려합니다.
부분 일치 항목이 누락됨	분석기가 예상과 다르게 토큰화되었습니다.	텍스트 분석 API에서 와일드카드(`*`) 접미사를 사용하거나 분석기 동작을 확인합니다.
필터가 작동하지 않음	필드를 필터링할 수 있는 것으로 표시되지 않습니다.	필드에 설정할 `filterable: true` 인덱스 스키마를 업데이트합니다.

이제 쿼리 요청의 작동 방식에 대한 이해도가 높아졌으므로 실습 환경에 대해 다음 빠른 시작을 시도합니다.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-01-23