AudioAnalyzerPreset Classe

Referência

A predefinição do Analisador de Áudio aplica um conjunto predefinido de operações de análise baseadas em IA, incluindo transcrição de fala. Atualmente, a predefinição dá suporta ao processamento de conteúdo com uma única faixa do áudio.

Você provavelmente deseja usar as subclasses e não essa classe diretamente. Subclasses conhecidas são: VideoAnalyzerPreset

Todos os parâmetros necessários devem ser preenchidos para enviar ao Azure.

Herança: azure.mgmt.media.models._models_py3.Preset

AudioAnalyzerPreset

Construtor

AudioAnalyzerPreset(*, audio_language: str | None = None, mode: str | _models.AudioAnalysisMode | None = None, experimental_options: Dict[str, str] | None = None, **kwargs)

Parâmetros de apenas palavra-chave

Nome	Description
audio_language	str O idioma do conteúdo de áudio na entrada usando o formato BCP-47 de 'language tag-region' (por exemplo, 'en-US'). Se você conhece o idioma do seu conteúdo, é recomendável especificá-lo. O idioma deve ser especificado explicitamente para AudioAnalysisMode::Basic, já que a detecção automática de idioma não está incluída no modo básico. Se o idioma não for especificado ou definido como nulo, a detecção automática de idioma escolherá o primeiro idioma detectado e processará com o idioma selecionado para a duração do arquivo. Ele não suporta no momento alternar dinamicamente entre os idiomas depois que o primeiro idioma for detectado. A detecção automática funciona melhor com gravações de áudio com fala claramente perceptível. Se a detecção automática não encontrar o idioma, a transcrição retornará para 'en-US'." A lista de idiomas com suporte está disponível aqui: https://go.microsoft.com/fwlink/?linkid=2109463.
mode	str ou AudioAnalysisMode Determina o conjunto de operações de análise de áudio a serem executadas. Se não for especificado, o Standard AudioAnalysisMode será escolhido. Os valores conhecidos são: "Standard" e "Basic".
experimental_options	dict[str, str] Dicionário que contém pares de valores de chave para parâmetros não expostos na própria predefinição.

Variáveis

Nome	Description
odata_type	str O discriminatório para tipos derivados. Obrigatórios.
audio_language	str O idioma do conteúdo de áudio na entrada usando o formato BCP-47 de 'language tag-region' (por exemplo, 'en-US'). Se você conhece o idioma do seu conteúdo, é recomendável especificá-lo. O idioma deve ser especificado explicitamente para AudioAnalysisMode::Basic, já que a detecção automática de idioma não está incluída no modo básico. Se o idioma não for especificado ou definido como nulo, a detecção automática de idioma escolherá o primeiro idioma detectado e processará com o idioma selecionado para a duração do arquivo. Ele não suporta no momento alternar dinamicamente entre os idiomas depois que o primeiro idioma for detectado. A detecção automática funciona melhor com gravações de áudio com fala claramente perceptível. Se a detecção automática não encontrar o idioma, a transcrição retornará para 'en-US'." A lista de idiomas com suporte está disponível aqui: https://go.microsoft.com/fwlink/?linkid=2109463.
mode	str ou AudioAnalysisMode Determina o conjunto de operações de análise de áudio a serem executadas. Se não for especificado, o Standard AudioAnalysisMode será escolhido. Os valores conhecidos são: "Standard" e "Basic".
experimental_options	dict[str, str] Dicionário que contém pares de valores de chave para parâmetros não expostos na própria predefinição.

Compartilhar via

AudioAnalyzerPreset Classe

Construtor

Parâmetros de apenas palavra-chave

Variáveis

Recursos adicionais