중요합니다
영어가 아닌 번역은 편의를 위해서만 제공됩니다. 바인딩 버전을 위해 이 문서의 EN-US
버전을 참조하세요.
투명성 고지란?
AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 의도한 목적에 맞는 시스템을 만들려면 기술의 작동 방식, 기능 및 제한 사항, 최상의 성능을 달성하는 방법에 대한 이해가 필요합니다.
Microsoft는 AI 기술의 작동 방식을 이해하는 데 도움이 되는 투명성 고지를 제공합니다. 여기에는 시스템 소유자가 시스템 성능 및 행동에 영향을 줄 수 있는 선택 사항과 기술, 사람 및 환경을 포함하여 전체 시스템에 대한 생각의 중요성이 포함됩니다. 투명성 고지는 자체 시스템을 개발 또는 배포할 때 사용하거나 시스템을 사용하거나 시스템의 영향을 받을 사람들과 공유할 수 있습니다.
투명성 고지는 AI 원칙을 실천하기 위한 Microsoft의 광범위한 노력의 일환입니다. 자세한 내용은 Microsoft의 AI 원칙을 참조하세요.
화자 인식 소개
화자 인식은 오디오 클립에서 개별 말하기를 식별할 수 있는 AI 기능입니다. 사람의 음성에는 개인과 연결할 수 있는 고유한 특성이 있습니다. Speaker Recognition은 들어오는 음성의 고유한 음성 특성을 등록된 음성 서명과 비교하여 스피커를 인식할 수 있습니다. 자세한 내용은 Speaker Recognition을 참조하세요.
화자 인식의 기본 사항
화자 인식 기능은 다음 두 가지 API를 통해 제공됩니다.
화자 확인을 사용하면 "이 Anna가 말하는가?"와 같은 시나리오를 결정할 수 있습니다. 음성의 음성 특성을 클레임된 ID의 등록된 음성 서명과 비교하여 개인의 ID를 확인합니다.
화자 식별 을 사용하면 "누가 말하고 있는지, Anna, Isha 또는 Jing?"와 같은 시나리오를 결정할 수 있습니다. 등록된 개인 그룹 내의 개별 화자에게 음성을 할당합니다.
기간 | 정의 |
---|---|
음성 서명 | 템플릿 또는 음성 인쇄라고도 합니다. 말하는 사람의 오디오 녹음에서 추출된 개인의 음성 특성을 나타내는 숫자 벡터입니다. 음성 서명에 따라 원래 오디오 녹음을 해석하거나 재구성할 수 없습니다. 음성 서명 품질은 결과의 정확도를 결정하는 핵심 요소입니다. |
등록 | 등록은 개인 음성의 오디오 파일에서 음성 서명을 만드는 프로세스이므로 나중에 인식할 수 있습니다. 사용자가 인식 시스템에 등록되면 해당 사용자의 템플릿은 인식 음성 입력과 비교할 음성 서명을 결정하는 데 사용되는 기본 식별자1 과도 연결됩니다. |
인식 | 인식 중에 말하는 사람의 오디오가 하나 이상의 음성 서명과 비교됩니다. 오디오가 하나의 특정 음성 서명과 비교되는 경우 이 프로세스를 확인 이라고 합니다. 오디오를 둘 이상의 음성 서명과 비교하여 화자를 식별하는 경우 식별 이라고 합니다. |
텍스트 종속 화자 검증 | 활성 확인이라고도 합니다. 화자는 등록 및 확인 단계 모두에서 말할 특정 암호(단어 집합)를 선택합니다. 확인 중에 시스템은 암호 텍스트를 인식하고 등록 암호와 비교합니다. 결과는 음성 서명 일치와 암호 일치를 모두 기반으로 합니다. |
암호 서명 | 텍스트 종속 API의 등록 오디오에서 선택한 암호는 텍스트로 인식됩니다. 그런 다음 음성 서명과 암호 텍스트가 모두 저장됩니다. "내 목소리는 내 여권 확인"과 같은 고유한 암호를 암호 서명이라고 합니다. 암호 서명은 인식 중에 음성 오디오 입력 텍스트와도 비교됩니다. |
텍스트 독립 화자 검증 | 수동 확인이라고도 합니다. 스피커는 미리 정의된 단어를 말할 필요가 없으며, 대신 발표자는 모든 구를 사용할 수 있습니다. 음성 서명은 확인 중에 사용되지만 음성 콘텐츠는 고려되지 않습니다. 인식 중에 화자가 등록 중에 했던 것과 동일한 구를 반드시 사용할 필요는 없습니다. 안정적인 성능을 얻으려면 등록하는 동안 오디오 녹음 시간이 길어지는 것이 좋습니다. |
활성화 문구 | 활성 등록이 가능해진 상태에서 텍스트 독립 API를 사용할 경우, 사용자는 등록 절차의 시작에서 필수적으로 읽어야 하는 미리 정의된 문구가 있습니다. 발표자는 인식 프로세스 중에 텍스트 독립적 화자 확인 또는 식별에서 모든 구를 사용할 수 있지만 활성 등록을 사용하도록 설정하면 Microsoft에서는 화자가 이 활성화 구를 먼저 읽도록 요구합니다. 활성화 단계가 끝나면 스피커는 임의의 문구를 사용하여 등록을 계속할 수 있습니다. |
1 개발자는 Microsoft에서 생성한 GUID(전역적으로 고유한 식별자)를 개인의 기본 식별자와 연결하여 해당 개인의 확인을 지원할 수 있습니다. Speaker Recognition은 고객 ID와 같은 기본 식별자를 음성 서명과 함께 저장하지 않습니다. 대신 Microsoft는 저장된 음성 서명을 임의의 GUID와 연결합니다.
화자 인식에 대한 제한된 액세스
Speaker Recognition은 제한된 액세스 서비스이며 일부 기능에 액세스하려면 등록이 필요합니다. Microsoft의 제한된 액세스 정책에 대한 자세한 내용은 aka.ms/limitedaccesscogservices 방문하세요. 특정 기능은 Microsoft 관리 고객 및 파트너만 사용할 수 있으며 등록 시 선택한 특정 사용 사례에 대해서만 사용할 수 있습니다.
승인된 사용 사례
고객에 대해 승인된 사용 사례는 다음과 같습니다.
- 고객 ID 확인: 통화 센터 또는 대화형 음성 응답 시스템은 발신자가 고객의 정보에 액세스하거나 고객의 계정과 관련하여 조치를 취하려고 할 때 화자 확인을 사용하여 고객의 ID를 확인할 수 있습니다.
- 다단계 인증: 보안을 강화하기 위해 등록된 음성 서명과 음성 특성을 일치시켜 ID를 확인합니다.
- 스마트 디바이스 개인 설정: 스마트 차량 또는 스마트 스피커와 같은 음성 지원 상호 작용 장치는 Speaker Recognition을 사용하여 개인 설정된 콘텐츠를 제공할 수 있습니다. 예를 들어 텍스트 독립적 Speaker Verification API를 사용하여 가정에서 음성 명령에 응답하여 다양한 유형의 영화 또는 음악을 재생할 수 있습니다.
- 모임에 대한 화자 ID: 모임 전사 또는 캡션에서 개별 화자를 식별합니다.
- [공공 부문만 해당] 화자 식별 또는 확인: (a) 중대한 범죄의 기소 또는 방어에 법 집행 기관이나 법원 공무원을 지원하거나, 모든 경우에 공정하고 독립적인 사법부를 유지하는 관할권에서 발행된 법원 명령에 의해 특별히 승인된 범위 내에서만 실종자를 식별할 수 있으며, 그 사람이 식별되거나 확인되기를 원하는 경우는 미성년자가 아닙니다. OR (b) 국제형사법, 국제인권법 또는 국제 인도주의법의 남용을 기소할 때 정식으로 권한을 부여받은 국제기구의 공무원을 지원합니다.
화자 인식 사용 시 고려 사항
- 음성 입력에서 여러 스피커를 인식하는 데 사용하지 마십시오 . 화자 인식은 단일 음성 입력에서 둘 이상의 사람을 인식할 수 없습니다. 화자 인식은 한 사람의 음성 입력을 받아 하나 이상의 음성 서명과 비교하기 위한 것입니다.
- 보안이 중요한 인증의 유일한 요소로 사용하지 않도록 합니다 . 화자 인식은 합성된 음성 또는 음성 녹음을 라이브 휴먼 스피커와 구분하도록 설계되지 않았습니다. 스푸핑 위험이 있는 시나리오를 신중하게 고려합니다. 스피커 인식은 금융 정보 또는 물리적 보안에 대한 액세스와 같이 보안이 목표인 애플리케이션에서 사용자를 인증하는 유일한 요소로 사용해서는 안 됩니다.
- 사용자를 적극적으로 등록합니다 . 음성 서명에는 스피커의 생체 인식 음성 인쇄 특성이 포함되어 있습니다. 화자 인식의 오용을 방지하기 위해 Microsoft는 활성화 단계를 통해 텍스트 독립적 API 사용자를 위한 활성 등록 기능을 제공합니다. 활성화 단계는 화자가 음성 서명을 만드는 데 적극적으로 참여했음을 나타내며, 해당 인식 없이 스피커가 등록되는 시나리오를 방지하기 위한 것입니다. 이 활성화 단계는 생성된 화자 서명의 처리, 보존 및 의도된 사용을 위해 필요한 모든 사용 권한과 동의를 사용자로부터 받았는지 확인하는 고객의 법적 의무를 완화하지 않습니다.
- 화자 식별을 위한 후보 수를 제한합니다. Speaker Identification API는 API 호출에서 음성 입력을 비교하는 데 최대 50명의 후보만 사용할 수 있습니다.
- 법률 및 규제 고려 사항: 조직은 모든 업계 또는 시나리오에서 사용하기에 적합하지 않을 수 있는 AI 서비스 및 솔루션을 사용할 때 잠재적인 특정 법률 및 규제 의무를 평가해야 합니다. 또한 AI 서비스나 솔루션은 해당 서비스 약관 및 관련 행동 강령에서 금지하는 방식으로 설계되지 않았으며, 그러한 방식으로 사용될 수 없습니다.