音声翻訳とは何か
この記事では、多言語のオーディオ ストリームをリアルタイムで音声間の翻訳または音声テキスト変換できる音声翻訳サービスの利点と機能について説明します。
Speech SDK または Speech CLI を使用すると、アプリケーション、ツール、デバイスから、提供されたオーディオのソース トランスクリプションや翻訳出力にアクセスできます。 音声の検出中には中間トランスクリプションと翻訳結果が返され、最終的な結果は、合成された音声に変換することができます。
音声翻訳でサポートされている言語の一覧については、「言語と音声のサポート」を参照してください。
コア機能
- 認識結果を使用した音声テキスト翻訳。
- 音声間翻訳。
- 複数のターゲット言語への翻訳をサポート。
- 中間認識と翻訳結果。
はじめに
最初の手順として、音声翻訳のクイック スタートをお試しください。 音声翻訳サービスは、Speech SDK と Speech CLI を介して利用できます。
GitHub に Speech SDK の音声テキスト変換と翻訳のサンプルがあります。 これらのサンプルは、ファイルやストリームからの音声の読み取り、連続的および単発の認識と翻訳、カスタム モデルの使用など、一般的なシナリオを対象としています。
次のステップ
- 音声翻訳のクイックスタートを試す
- Speech SDK をインストールする
- Speech CLI をインストールする