Speech CLI란?

Speech CLI는 코드를 작성할 필요 없이 Speech Service를 사용하기 위한 명령줄 도구입니다. Speech CLI에는 최소한의 설정이 필요합니다. 이를 쉽게 사용하여 Speech Service의 주요 기능을 실험하고 사용 사례에서 어떻게 작동하는지 확인할 수 있습니다. 몇 분 안에 파일 디렉터리의 일괄 처리 음성 인식 또는 파일의 문자열 컬렉션에 대한 텍스트 음성 변환과 같은 간단한 테스트 워크플로를 실행할 수 있습니다. 간단한 워크플로 외에도, 음성 CLI는 프로덕션 준비가 되어 있으며 자동화된 .bat 또는 셸 스크립트를 사용하여 더 큰 프로세스를 실행하도록 확장할 수 있습니다.

Speech SDK의 대부분의 기능은 Speech CLI에서 사용할 수 있으며 일부 고급 기능 및 사용자 지정은 Speech CLI에서 단순화됩니다. Speech CLI 또는 Speech SDK를 사용할 시기를 결정할 때 다음 지침을 고려합니다.

다음 경우에 Speech CLI를 사용합니다.

  • 최소한의 설정으로 코드를 작성할 필요 없이 Speech Service 기능을 실험하려고 합니다.
  • Speech Service를 사용하는 프로덕션 애플리케이션에 대한 요구 사항은 비교적 간단합니다.

다음과 같은 경우 Speech SDK를 사용합니다.

  • 특정 언어 또는 플랫폼(예: C#, Python 또는 C++) 내에서 Speech Service 기능을 통합하려고 합니다.
  • 고급 서비스 요청을 요구할 수 있는 복잡한 요구 사항이 있습니다.
  • 응답 스트리밍을 포함하여 사용자 지정 동작을 개발하고 있습니다.

핵심 기능

  • 음성 인식: 오디오 파일 또는 마이크에서 직접 음성을 텍스트로 변환하거나 녹음된 대화를 전사합니다.

  • 음성 합성: 텍스트 파일에서 입력을 사용하거나 명령줄에서 직접 입력하여 텍스트를 음성으로 변환합니다. SSML(Speech Synthesis Markup Language) 구성을 사용하여 음성 출력 특성을 사용자 지정합니다.

  • 음성 번역: 소스 언어의 오디오를 대상 언어의 텍스트 또는 오디오로 번역합니다.

  • Azure 컴퓨팅 리소스에서 실행: spx webjob을 사용하여 Azure 원격 컴퓨팅 리소스에서 실행할 Speech CLI 명령을 보냅니다.

시작하기

Speech CLI를 시작하려면 빠른 시작을 참조하세요. 이 문서에서는 몇 가지 기본 명령을 실행하는 방법을 보여 줍니다. 또한 음성 텍스트 변환 및 텍스트 음성 변환을 위한 일괄 처리 작업을 실행하기 위한 약간 더 고급 명령을 제공합니다. 기본 문서를 읽은 후에는 일부 사용자 지정 명령 작성을 시작하거나 간단한 Speech Service 작업을 자동화하기 위한 구문을 충분히 이해해야 합니다.

다음 단계