バッチ文字起こしとは

2025-05-25

バッチ文字起こしは、ストレージ内の大量のオーディオデータを文字起こしする場合に使用されます。音声テキスト変換 REST API と Speech CLI の両方で、バッチ文字起こしがサポートされています。

要求ごとに複数のファイルを提供するか、文字起こしするオーディオファイルを含む Azure Blob Storage コンテナーをポイントする必要があります。バッチ文字起こしサービスでは、送信された多数の文字起こしを処理できます。サービスによってファイルが同時に文字起こしされ、ターンアラウンド時間が短縮されます。

それはどのように機能するのでしょうか。

バッチ文字起こしでは、オーディオデータを送信し、文字起こしの結果を非同期的に取得します。サービスではオーディオデータを文字起こしし、その結果をストレージコンテナーに格納します。その後、ストレージコンテナーから結果を取得できます。

ヒント

ローまたはノーコードのソリューションの場合は、Power Automate、Power Apps、Logic Apps などの Power Platform アプリケーションでバッチ音声テキスト変換コネクタを使用できます。開始するには、「Power でバッチ文字起こしを自動化する」ガイドを参照してください。

バッチ文字起こし REST API を使用するには:

バッチ文字起こし用のオーディオファイルを検索する - 独自のデータをアップロードするか、パブリック URI または Shared Access Signature (SAS) URI を使用して既存のオーディオファイルを使用できます。
バッチ文字起こしを作成する - オーディオファイル、文字起こし言語、文字起こしモデルなどのパラメーターを使用して文字起こしジョブを送信します。
バッチ文字起こしの結果を取得する - 文字起こしの状態を確認し、文字起こしの結果を非同期で取得します。

重要

バッチ文字起こしジョブは、ベストエフォートの原則でスケジュールされます。ピーク時には、文字起こしジョブの処理が開始されるまでに最大 30 分以上かかることがあります。バッチ文字起こしジョブの現在の状態を確認する方法については、こちらのセクションを参照してください。

次の方法で共有

バッチ文字起こしとは

それはどのように機能するのでしょうか。

関連コンテンツ

フィードバック

その他のリソース