AudioAnalyzerPreset Classe
A predefinição do Analisador de Áudio aplica um conjunto predefinido de operações de análise baseadas em IA, incluindo transcrição de fala. Atualmente, a predefinição dá suporta ao processamento de conteúdo com uma única faixa do áudio.
Você provavelmente deseja usar as subclasses e não essa classe diretamente. Subclasses conhecidas são: VideoAnalyzerPreset
Todos os parâmetros necessários devem ser preenchidos para enviar ao Azure.
- Herança
-
azure.mgmt.media.models._models_py3.PresetAudioAnalyzerPreset
Construtor
AudioAnalyzerPreset(*, audio_language: str | None = None, mode: str | _models.AudioAnalysisMode | None = None, experimental_options: Dict[str, str] | None = None, **kwargs)
Parâmetros de apenas palavra-chave
Nome | Description |
---|---|
audio_language
|
O idioma do conteúdo de áudio na entrada usando o formato BCP-47 de 'language tag-region' (por exemplo, 'en-US'). Se você conhece o idioma do seu conteúdo, é recomendável especificá-lo. O idioma deve ser especificado explicitamente para AudioAnalysisMode::Basic, já que a detecção automática de idioma não está incluída no modo básico. Se o idioma não for especificado ou definido como nulo, a detecção automática de idioma escolherá o primeiro idioma detectado e processará com o idioma selecionado para a duração do arquivo. Ele não suporta no momento alternar dinamicamente entre os idiomas depois que o primeiro idioma for detectado. A detecção automática funciona melhor com gravações de áudio com fala claramente perceptível. Se a detecção automática não encontrar o idioma, a transcrição retornará para 'en-US'." A lista de idiomas com suporte está disponível aqui: https://go.microsoft.com/fwlink/?linkid=2109463. |
mode
|
Determina o conjunto de operações de análise de áudio a serem executadas. Se não for especificado, o Standard AudioAnalysisMode será escolhido. Os valores conhecidos são: "Standard" e "Basic". |
experimental_options
|
Dicionário que contém pares de valores de chave para parâmetros não expostos na própria predefinição. |
Variáveis
Nome | Description |
---|---|
odata_type
|
O discriminatório para tipos derivados. Obrigatórios. |
audio_language
|
O idioma do conteúdo de áudio na entrada usando o formato BCP-47 de 'language tag-region' (por exemplo, 'en-US'). Se você conhece o idioma do seu conteúdo, é recomendável especificá-lo. O idioma deve ser especificado explicitamente para AudioAnalysisMode::Basic, já que a detecção automática de idioma não está incluída no modo básico. Se o idioma não for especificado ou definido como nulo, a detecção automática de idioma escolherá o primeiro idioma detectado e processará com o idioma selecionado para a duração do arquivo. Ele não suporta no momento alternar dinamicamente entre os idiomas depois que o primeiro idioma for detectado. A detecção automática funciona melhor com gravações de áudio com fala claramente perceptível. Se a detecção automática não encontrar o idioma, a transcrição retornará para 'en-US'." A lista de idiomas com suporte está disponível aqui: https://go.microsoft.com/fwlink/?linkid=2109463. |
mode
|
Determina o conjunto de operações de análise de áudio a serem executadas. Se não for especificado, o Standard AudioAnalysisMode será escolhido. Os valores conhecidos são: "Standard" e "Basic". |
experimental_options
|
Dicionário que contém pares de valores de chave para parâmetros não expostos na própria predefinição. |
Azure SDK for Python