次の方法で共有


AudioAnalyzerPreset クラス

Audio Analyzer プリセットは、音声の文字起こしを含む、事前に定義された AI ベースの分析操作のセットを適用します。 現在、プリセットは単一のオーディオ トラックでのコンテンツ処理をサポートしています。

このクラスを直接使用せず、サブクラスを使用する必要がある場合があります。 既知のサブクラスは次のとおりです。VideoAnalyzerPreset

Azure に送信するには、必要なすべてのパラメーターを設定する必要があります。

継承
azure.mgmt.media.models._models_py3.Preset
AudioAnalyzerPreset

コンストラクター

AudioAnalyzerPreset(*, audio_language: str | None = None, mode: str | _models.AudioAnalysisMode | None = None, experimental_options: Dict[str, str] | None = None, **kwargs)

キーワードのみのパラメーター

名前 説明
audio_language
str

BCP-47 形式の 'language tag-region' (例: 'en-US') を使用する入力内のオーディオ ペイロードの言語。 コンテンツの言語がわかっている場合は、指定することをお勧めします。 言語の自動検出は基本モードに含まれていないため、AudioAnalysisMode::Basic に対して言語を明示的に指定する必要があります。 言語が指定されていないか、null 値に設定されている場合、自動言語検出は、最初に検出された言語を選択し、ファイルの実行中、選択された言語で処理を行います。 現在、最初の言語が検出された後に複数の言語を動的に切り替えることはサポートされていません。 自動検出は、明確に識別可能な音声を使用したオーディオ録音に最適です。 自動検出で言語が見つからない場合、文字起こしは 'en-US' にフォールバックします。サポートされている言語の一覧は、 https://go.microsoft.com/fwlink/?linkid=2109463にあります。

mode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。 既知の値は、"Standard" と "Basic" です。

experimental_options

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ。

変数

名前 説明
odata_type
str

派生型の識別子。 必須。

audio_language
str

BCP-47 形式の 'language tag-region' (例: 'en-US') を使用する入力内のオーディオ ペイロードの言語。 コンテンツの言語がわかっている場合は、指定することをお勧めします。 言語の自動検出は基本モードに含まれていないため、AudioAnalysisMode::Basic に対して言語を明示的に指定する必要があります。 言語が指定されていないか、null 値に設定されている場合、自動言語検出は、最初に検出された言語を選択し、ファイルの実行中、選択された言語で処理を行います。 現在、最初の言語が検出された後に複数の言語を動的に切り替えることはサポートされていません。 自動検出は、明確に識別可能な音声を使用したオーディオ録音に最適です。 自動検出で言語が見つからない場合、文字起こしは 'en-US' にフォールバックします。サポートされている言語の一覧は、 https://go.microsoft.com/fwlink/?linkid=2109463にあります。

mode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。 既知の値は、"Standard" と "Basic" です。

experimental_options

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ。