투명도 참고: Azure AI 검색

중요합니다

영어가 아닌 번역은 편의를 위해서만 제공됩니다. 최종 버전은 이 문서의 EN-US 버전 참조하세요.

투명성 노트란 무엇인가요?

AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 의도한 목적에 맞는 시스템을 만들려면 기술의 작동 방식, 기능 및 제한 사항 및 최상의 성능을 달성하는 방법에 대한 이해가 필요합니다. Microsoft의 투명성 고지는 Microsoft의 AI 기술의 작동 방식, 시스템 소유자가 시스템 성능과 동작에 영향을 줄 수 있는 선택 사항 그리고 기술, 사람, 환경을 포함한 전체 시스템에 대한 사고의 중요성을 이해하는 데 도움을 주기 위한 것입니다. 고유한 시스템을 개발하거나 배포할 때 투명도 메모를 사용하거나 시스템의 영향을 받는 사용자와 공유할 수 있습니다.

Microsoft의 투명성 고지는 AI 원칙을 실천하기 위한 Microsoft의 광범위한 노력의 일환입니다. 자세한 내용은 Microsoft AI 원칙을 참조하세요.

소개

Azure AI 검색 개발자 도구, API 및 SDK를 제공하여 웹, 모바일 및 엔터프라이즈 애플리케이션에서 다른 유형의 프라이빗 콘텐츠를 통해 풍부한 검색 환경을 구축할 수 있습니다. 검색은 사용자에게 데이터를 표시하는 모든 애플리케이션의 기초입니다. 일반적인 시나리오에는 카탈로그 또는 문서 검색, 온라인 소매점 또는 독점 콘텐츠에 대한 데이터 탐색이 포함됩니다.

검색 가능한 데이터는 텍스트 또는 벡터 형식이고 데이터 원본에서 as-is 수집하거나 AI를 사용하여 보강하여 전체 검색 환경을 개선할 수 있습니다. 개발자는 외부 machine learning 모델(포함 모델이라고 함)을 호출하도록 선택하여 데이터 int를 숫자 표현(벡터라고 함)으로 변환할 수 있습니다. 인덱서는 필요에 따라 Foundry 도구의 다양한 Azure 언어 기능을 통해 강력한 데이터 보강 제품군을 지원하는 기술 집합을 포함할 수 있습니다. 이름 지정된 엔터티 인식 (NER), 개인 식별 가능 정보 (PII) 검색과 같은 기능, 그리고 Azure 비전(Foundry 도구 내) 기능을 통한 광학 문자 인식 (OCR), 이미지 분석을 포함하는 기능들이 있습니다.

Foundry 도구 또는 다른 AI 시스템을 사용하여 고객 콘텐츠의 의도, 의미 체계 및 암시적 구조를 더 잘 이해함으로써 Azure AI 검색 검색 환경을 개선하는 방법에 대한 자세한 내용은 다음 탭을 참조하세요.

AI 보강은 원시 형식으로 쉽게 검색할 수 없는 콘텐츠에 대해 Foundry 도구의 machine learning 모델을 적용합니다. 보강을 통해 분석 및 유추를 사용하여 이전에 존재하지 않았던 검색 가능한 콘텐츠와 구조를 만듭니다.

AI 강화는 고객의 검색 서비스와 동일한 지역에 있는 Foundry 도구에 연결하는 Azure AI 검색 인덱서 파이프라인의 선택적 확장입니다. 보강 파이프라인에는 일반적인 인덱서(인덱서, 데이터 원본, 인덱스)와 동일한 핵심 구성 요소와 원자성 보강 단계를 지정하는 기술 집합이 있습니다. 기술 집합은 사용자가 제공하는 외부 코드를 실행하는 VisionLanguage 또는 custom skills 같은 Foundry Tools API를 기반으로 하는 기본 제공 기술을 사용하여 어셈블할 수 있습니다.

역량

시스템 동작

여러 내장된 기능은 Azure AI 검색의 Foundry 도구를 활용하여 AI 강화에 이점을 제공합니다. 기술 사용을 선택할 때 고려 사항은 아래에 연결된 각 기본 제공 기술에 대한 투명도 메모를 참조하세요.

통합 및 책임 있는 사용을 위한 각 기능, 제한 사항, 성능, 평가 및 방법에 대해 자세히 알아보려면 각 기술에 대한 설명서를 참조하세요. 이러한 기술을 함께 사용하면 복합 효과가 발생할 수 있습니다(예를 들어 OCR을 사용할 때 발생하는 오류는 핵심 구 추출을 사용할 때 수행됩니다).

사용 사례

사용 사례 예

Azure AI 검색 전체 텍스트 검색 솔루션이므로 AI 보강의 목적은 구조화되지 않은 콘텐츠의 검색 유틸리티를 개선하는 것입니다. 기본 제공 기술에서 지원하는 콘텐츠 보강 시나리오의 몇 가지 예는 다음과 같습니다.

  • 번역언어 검색 을 통해 다국어를 검색할 수 있습니다.
  • 엔터티 인식 은 텍스트의 큰 덩어리에서 사람 , 장소기타 엔터티 를 추출합니다.
  • 핵심 구 추출 은 중요한 용어를 식별한 다음 출력합니다.
  • OCR 은 이진 파일에서 인쇄 및 필기 텍스트를 인식합니다.
  • 이미지 분석은 이미지 콘텐츠를 설명하고 설명을 검색 가능한 텍스트 필드로 출력합니다.
  • 통합된 벡터화는 Azure OpenAI 임베딩 모델을 호출하여 데이터를 벡터화하고 유사성 검색을 위해 Azure AI 검색에 임베딩을 저장하는 미리 보기 기능입니다.

제한점

Azure AI 검색 AI 보강은 서비스의 인덱서 및 데이터 원본 기능을 사용하여 Foundry Tools를 호출하여 콘텐츠 보강을 수행합니다. 이 프로세스에 사용되는 인덱서 및 데이터 원본의 제한 사항이 적용됩니다. 이러한 관련 제한 사항에 대한 자세한 내용은 인덱서 및 데이터 원본 설명서를 검토하세요. Azure AI 검색 AI 보강 파이프라인에서 사용하는 각 Foundry 도구의 제한 사항도 적용됩니다. 이러한 제한 사항에 대한 자세한 내용은 각 서비스에 관한 투명성 노트를 참조하세요.

책임감 있는 AI에 대해 자세히 알아보기