Speech CLI は、コードを記述せずに Foundry Tools で Azure Speech を使用するためのコマンド ライン ツールです。 Speech CLI では最小限のセットアップが必要であり、音声サービスの主要な機能の実験をすぐに開始できます。 数分以内に、ファイルのディレクトリからのバッチ音声認識や、ファイルからの文字列のコレクションに対するテキスト読み上げなどの簡単なテスト ワークフローを実行します。 単純なワークフロー以外にも、Speech CLI は運用環境に対応しています。 自動化された .bat またはシェル スクリプトを使用して、大規模なプロセスを実行するようにスケールアップします。
Speech SDK のほとんどの機能は Speech CLI で利用でき、一部の高度な機能とカスタマイズは簡略化されています。 Speech CLI と Speech SDK のどちらかを選択する場合は、次のガイダンスを検討してください。
Speech CLI を使用する場合
- 最小限の設定で、コードを使用せずに、Speech サービスの機能を実験する必要があります。
- Speech サービスを使用する運用アプリケーションには、比較的単純な要件があります。
Speech SDK を使用する場合
- 特定の言語またはプラットフォーム (C#、Python、C++ など) で、Speech サービスの機能を統合する必要があります。
- 高度なサービス要求が必要となる可能性がある複雑な要件があります。
- 応答ストリーミングなどのカスタム動作を開発しています。
コア機能
音声認識: 音声をオーディオ ファイルからテキストに変換するか、マイクから直接変換するか、録音された会話を文字起こしします。
音声合成: テキストをテキスト ファイルから音声に変換するか、コマンド ラインから直接変換します。 音声合成マークアップ言語 (SSML) 構成を使用して、音声出力の特性をカスタマイズします。
音声翻訳: ソース言語の音声をターゲット言語のテキストまたは音声に翻訳します。
Azure コンピューティング:
spx webjobを使用して、Azure リモート コンピューティング リソースで実行する Speech CLI コマンドを送信します。
概要
Speech CLI の使用を開始するには、クイックスタートを参照してください。 この記事では、基本的なコマンドを実行する方法について説明し、音声テキスト変換とテキスト読み上げのバッチ操作を実行するためのより高度なコマンドを提供します。 基本記事を読むと、カスタム コマンドを記述したり、簡単な Speech Service 操作を自動化したりするための構文について十分に理解できます。