한국어 음성인식 품질 문제

전동준/SGE 선행AI기술팀 0 평판 포인트
2025-05-16T00:26:37.6166667+00:00

실시간 음성 텍스트 변환 서비스에서

한국어가 숫자로 될 경우가 많습니다. (e.g. 제일 좋아하는 -> 제1 좋아하는)

추가학습이나 후처리 방식 이외에 이를 해결할 방법이 있나요?

구목록 추가로는 해결되지 않습니다.

Azure
Azure
Microsoft에서 관리하는 전 세계 데이터 센터 네트워크를 통해 애플리케이션과 서비스를 빌드, 배포, 관리하기 위한 클라우드 컴퓨팅 플랫폼 및 인프라입니다.
질문 136개
투표 {count}개

답변 1개

정렬 기준: 가장 유용함
  1. kothapally Snigdha 3,095 평판 포인트 Microsoft 외부 직원 Moderator
    2025-05-20T04:53:33.0533333+00:00

    Hi 전동준/SGE 선행AI기술팀

    Azure Speech Services를 사용한 실시간 음성 텍스트 변환에서, '최고'와 같은 한국어 단어가 자주 '1등'으로 전사되는 알려진 문제가 있습니다. 이는 Azure가 구어를 더 표준화된 서면 양식으로 변환하려고 시도하는 텍스트 정규화라는 프로세스를 자동으로 적용하기 때문입니다. 한국어에서는 이러한 과정으로 인해 순위와 관련된 단어가 숫자로 대체되는 경우가 많습니다. 이 문제를 피하려면 기본 전사 출력을 신뢰하기보다는 Azure에서 제공하는 '상세' 출력 형식을 사용하는 것이 좋습니다. 이 형식은 전사된 텍스트의 여러 버전을 제공하며, '어휘' 형태라고 하는 것을 포함합니다. 어휘 형태는 실제로 발화된 내용의 원형 버전을 포함하고 있어 숫자나 표시 친화적인 형식으로 변환되지 않습니다. 이 어휘 버전을 사용하면 '최고'와 같은 원래의 단어를 보존하고 '1등'으로 변경되는 것을 방지할 수 있습니다.

    이 접근 방법은 추가적인 모델 훈련이나 복잡한 후처리를 필요로 하지 않습니다. 필요한 경우, 실제로 순위와 관련이 없는 맥락에서는 애플리케이션에서 '1등'을 '최고'로 교체하는 간단한 규칙을 적용할 수도 있습니다. 그러나 일반적으로 상세한 출력에서 나오는 어휘 형태를 사용하는 것이 가장 좋고 쉬운 솔루션입니다.

    아래 문서를 참조해 주세요. https://learn.microsoft.com/ko-kr/azure/ai-services/speech-service/display-text-format?utm_source=chatgpt.com&pivots=programming-language-csharp

    https://learn.microsoft.com/ko-kr/azure/ai-services/speech-service/how-to-custom-speech-display-text-format?utm_source=chatgpt.com

    이것들이 도움이 되길 바랍니다. 감사합니다!


답변

질문 작성자가 수락한 답변이라고 답변에 표시할 수 있으며, 이를 통해 작성자의 문제를 해결한 답변을 사용자가 알 수 있도록 도와줍니다.