인덱싱 중 추가 처리를 위한 기술(Azure AI 검색)

이 문서에서는 외부 처리에 액세스하기 위해 기술 세트에 포함할 수 있는 Azure AI 검색에 제공되는 기술에 대해 설명합니다.

기술은 어떤 방식으로든 콘텐츠를 변환하는 원자성 작업을 제공합니다. 텍스트를 인식하거나 추출하는 작업인 경우가 많지만 이미 만들어진 보강을 변형하는 유틸리티 기술일 수도 있습니다. 일반적으로 출력은 텍스트 기반이므로 전체 텍스트 검색 또는 벡터 검색에 사용되는 벡터에 사용할 수 있습니다.

기술은 다음과 같은 범주로 구성됩니다.

  • 기본 제공 기술은 입력, 출력 및 처리 단계를 잘 이해할 수 있는 Azure 리소스에 대한 API 호출을 래핑합니다. Azure AI 리소스를 호출하는 기술의 경우 내부 네트워크를 통해 연결됩니다. Azure OpenAI를 호출하는 기술의 경우 검색 서비스가 리소스에 연결하는 데 사용하는 연결 정보를 제공합니다. 소량의 처리는 비용이 청구되지 않지만 대량 처리에는 비용이 청구됩니다. 기본 제공 기술은 Microsoft에서 미리 학습된 모델을 기반으로 하기 때문에 사용자 고유의 학습 데이터를 사용하여 모델을 학습시킬 수 없습니다.

  • 사용자 지정 기술은 검색 서비스 외부에서 실행되는 사용자 지정 코드를 제공합니다. URI를 통해 액세스됩니다. 사용자 지정 코드는 종종 Azure 함수 앱을 통해 사용할 수 있습니다. 오픈 소스 또는 타사 벡터화 모델을 연결하려면 사용자 지정 기술을 사용합니다.

  • 유틸리티는 Azure AI 검색 내부에 있으며 외부 리소스나 아웃바운드 연결에 종속되지 않습니다. 대부분의 유틸리티는 청구할 수 없습니다.

Azure AI 리소스 기술

Azure AI를 호출하는 기술은 AI 서비스 리소스 연결 시 종량제 요금으로 청구됩니다.

OData 형식 설명 요금제 기준
Microsoft.Skills.Text.CustomEntityLookupSkill 사용자 지정 사용자 정의 목록에서 텍스트를 찾습니다. Azure AI 검색(가격 책정)
Microsoft.Skills.Text.KeyPhraseExtractionSkill 이 기술은 미리 학습된 모델을 통해 용어 배치, 언어 규칙, 다른 용어에 대한 근접성 및 원본 데이터 내에서 용어가 비정상적인 정도에 따라 중요한 문구를 검색합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.LanguageDetectionSkill 이 기술은 미리 학습된 모델을 통해 사용되는 언어를 검색합니다(문서당 언어 ID 1개). 동일한 텍스트 세그먼트 내에서 여러 언어가 사용되는 경우 주로 사용된 언어의 LCID가 출력됩니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.V3.EntityLinkingSkill 이 기술은 미리 학습된 모델을 사용하여 Wikipedia의 문서에 대해 인식된 엔터티에 대한 링크를 생성합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.V3.EntityRecognitionSkill 이 기술은 미리 학습된 모델을 사용해 고정된 범주 집합("Person", "Location", "Organization", "Quantity", "DateTime", "URL", "Email", "PersonType", "Event", "Product", "Skill", "Address", "Phone Number""IP Address" 필드)에 대한 엔터티를 설정합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.PIIDetectionSkill 이 기술은 미리 학습된 모델을 사용하여 지정된 텍스트에서 개인 정보를 추출합니다. 또한 이 기술은 검색된 개인 정보 엔터티를 텍스트에서 마스킹하기 위한 다양한 옵션을 제공합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.V3.SentimentSkill 이 기술은 미리 학습된 모델을 사용하여 레코드별 기준으로 문장 및 문서 수준에서 서비스를 통해 찾은 가장 높은 신뢰도 점수에 따라 감정 레이블(예: "부정", "중립" 및 "긍정")을 할당합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Text.TranslationSkill 이 기술은 미리 학습된 모델을 사용하여 정규화 또는 지역화 사용 사례를 위해 입력 텍스트를 다양한 언어로 번역합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Vision.ImageAnalysisSkill 이 기술은 이미지 검색 알고리즘을 사용하여 이미지의 콘텐츠를 식별하고 텍스트 설명을 생성합니다. Azure AI 서비스(가격 책정)
Microsoft.Skills.Vision.OcrSkill 광학 문자 인식 Azure AI 서비스(가격 책정)

Azure OpenAI 기술

Azure OpenAI에 배포된 모델을 호출하는 기술은 종량제 요금으로 청구됩니다.

OData 형식 설명 요금제 기준
Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill 통합 벡터화를 위해 Azure OpenAI의 배포된 포함 모델에 연결합니다. Azure OpenAI(가격 책정)

유틸리티 기술

Azure AI 검색에서만 실행되고 보강 캐시의 노드에서 주로 반복되며 대부분은 청구되지 않습니다.

OData 형식 설명 요금제 기준
Microsoft.Skills.Util.ConditionalSkill 조건을 기준으로 필터링, 기본값 할당 및 데이터 병합을 허용합니다. 해당 없음
Microsoft.Skills.Util.DocumentExtractionSkill 보강 파이프라인 내 파일에서 콘텐츠를 추출합니다. 이미지 추출을 위한 Azure AI 검색(가격 책정)
Microsoft.Skills.Text.MergeSkill 필드 컬렉션에서 단일 필드로 텍스트를 통합합니다. 해당 없음
Microsoft.Skills.Util.ShaperSkill 출력을 복합 형식(전체 이름, 여러 줄로 이루어진 주소 또는 성과 개인 식별자의 조합에 사용될 수 있는 다중 파트 데이터 형식)에 매핑합니다. 해당 없음
Microsoft.Skills.Text.SplitSkill 콘텐츠를 증분 방식으로 보강하거나 보충할 수 있도록 텍스트를 페이지로 분할합니다. 해당 없음

사용자 지정 기술

사용자 지정 기술은 사용자가 디자인하고 개발하여 웹에 배포하는 외부 코드를 래핑합니다. 그런 다음, 기술 세트 내에서 모듈을 사용자 지정 기술로 호출할 수 있습니다.

Type 설명 요금제 기준
Microsoft.Skills.Custom.WebApiSkill 사용자 지정 웹 API에 대해 HTTP 호출을 수행하여 AI 보강 파이프라인의 확장성 허용 솔루션에서 요금제 Azure 서비스를 사용하지 않는 한 없음
Microsoft.Skills.Custom.AmlSkill Azure Machine Learning 모델을 사용하여 AI 보강 파이프라인의 확장성 허용 솔루션에서 요금제 Azure 서비스를 사용하지 않는 한 없음

사용자 지정 기술 생성에 대한 지침은 사용자 지정 인터페이스 정의예제: AI 보강의 사용자 지정 기술 만들기를 참조하세요.

참고 항목