다음을 통해 공유


Direct Line Speech란?

Direct Line Speech는 유연하고 확장 가능한 음성 도우미를 만들기 위한 강력한 엔드투엔드 솔루션입니다. Bot Framework 및 해당 Direct Line Speech 채널을 통해 구동되며, 봇과의 음성 입력, 출력 상호 작용에 최적화되어 있습니다.

음성 도우미는 사용자의 말을 듣고 대응 조치를 수행하며, 되묻는 경우가 많습니다. 음성 텍스트 변환을 사용하여 사용자의 음성을 전사한 다음, 텍스트에 대한 자연어 이해에 대한 작업을 수행합니다. 이 작업에는 텍스트 음성 변환으로 생성된 도우미의 음성 출력이 포함되는 경우가 많습니다.

Direct Line Speech는 음성 도우미에 대해 가장 높은 수준의 사용자 지정 및 정교함을 제공합니다. 작업 완료 또는 명령 및 제어 사용이 있는 두 가지의 무한, 자연적 또는 하이브리드인 대화형 시나리오를 위해 설계되었습니다. 이와 같이 유연성이 높아지면서 복잡성이 증가합니다. 자연어 입력을 사용하여 잘 정의된 태스크로 범위가 지정된 시나리오의 경우 사용자 지정 명령을 고려합니다.

Direct Line Speech에서 지원하는 로캘: ar-eg, ar-sa, ca-es, da-dk, de-de, en-au, en-ca, en-gb, en-in, en-nz, en-us, es-es, es-mx, fi-fi, fr-ca, fr-fr, gu-in, hi-in, hu-hu, it-it, ja-jp, ko-kr, mr-in, nb-no, nl-nl, pl-pl, pt-br, pt-pt, ru-ru, sv-se, ta-in, te-in, th-th, tr-tr, zh-cn, zh-hkzh-tw

Direct Line Speech 시작

Direct Line Speech를 사용하여 음성 도우미를 만들려면 Azure Portal에서 음성 리소스 및 Azure Bot 리소스를 만듭니다. 그런 다음, Direct Line Speech 채널에 봇을 연결합니다.

Conceptual diagram of the Direct Line Speech orchestration service flow

Direct Line Speech를 사용하여 간단한 음성 도우미를 만드는 전체 단계별 가이드는 Speech SDK 및 Direct Line Speech 채널을 사용하여 음성을 지원하도록 봇 설정에 대한 자습서를 참조하세요.

또한 코드를 실행하고 API를 빠르게 학습할 수 있도록 설계된 빠른 시작도 제공합니다. 이 표에는 언어 및 플랫폼별로 구성된 음성 도우미 빠른 시작 목록이 포함되어 있습니다.

빠른 시작 플랫폼 API 참조
C#, UWP Windows 찾아보기
Java Windows, macOS, Linux 찾아보기
Java Android 찾아보기

샘플 코드

음성 도우미를 만드는 샘플 코드는 GitHub에서 사용할 수 있습니다. 이러한 샘플을 사용하면 클라이언트 애플리케이션에서 여러 인기 프로그래밍 언어로 도우미에 연결할 수 있습니다.

사용자 지정

Speech Service를 사용하여 빌드된 음성 도우미는 음성 텍스트 변환, 텍스트 음성 변환사용자 지정 키워드 선택에 사용할 수 있는 모든 사용자 지정 옵션을 사용할 수 있습니다.

참고 항목

사용자 지정 옵션은 언어/로캘에 따라 다릅니다(지원되는 언어 참조).

음성 도우미에 대한 Direct Line Speech 및 관련 기능은 Virtual Assistant 솔루션 및 엔터프라이즈 템플릿에 적합합니다. Direct Line Speech는 호환 봇에서 작동할 수 있지만 이러한 리소스는 고품질의 대화형 환경뿐만 아니라 빠르게 시작할 수 있는 일반적인 지원 기술 및 모델에 재사용 가능한 기준을 제공합니다.

참조 문서

다음 단계