バッチ文字起こしとは
重要
新しい価格は、Speech to text REST API v3.2 を使用したバッチ文字起こしに対して有効です。 詳細については、価格ガイドを参照してください。
バッチ文字起こしは、ストレージ内の大量のオーディオ データを文字起こしする場合に使用されます。 音声テキスト変換 REST API と Speech CLI の両方で、バッチ文字起こしがサポートされています。
要求ごとに複数のファイルを提供するか、文字起こしするオーディオ ファイルを含む Azure Blob Storage コンテナーをポイントする必要があります。 バッチ文字起こしサービスでは、送信された多数の文字起こしを処理できます。 サービスによってファイルが同時に文字起こしされ、ターンアラウンド時間が短縮されます。
それはどのように機能するのでしょうか。
バッチ文字起こしでは、オーディオ データを送信し、文字起こしの結果を非同期的に取得します。 サービスではオーディオ データを文字起こしし、その結果をストレージ コンテナーに格納します。 その後、ストレージ コンテナーから結果を取得できます。
ヒント
ローまたはノーコードのソリューションの場合は、Power Automate、Power Apps、Logic Apps などの Power Platform アプリケーションでバッチ音声テキスト変換コネクタを使用できます。 開始するには、「Power でバッチ文字起こしを自動化する」ガイドを参照してください。
バッチ文字起こし REST API を使用するには:
- バッチ文字起こし用のオーディオ ファイルを検索する - 独自のデータをアップロードするか、パブリック URI または Shared Access Signature (SAS) URI を使用して既存のオーディオ ファイルを使用できます。
- バッチ文字起こしを作成する - オーディオ ファイル、文字起こし言語、文字起こしモデルなどのパラメーターを使用して文字起こしジョブを送信します。
- バッチ文字起こしの結果を取得する - 文字起こしの状態を確認し、文字起こしの結果を非同期で取得します。
重要
バッチ文字起こしジョブは、ベスト エフォートの原則でスケジュールされます。 ピークの時間帯には、文字起こしジョブの処理が開始されるまでに最大 30 分以上かかることもあります。 バッチ文字起こしジョブの現在の状態を確認する方法については、こちらのセクションを参照してください。