Configurar o armazenamento de dados da CLI de fala

Artigo
01/23/2024

A CLI de fala pode confiar em configurações em arquivos de configuração, que você pode consultar usando um @ símbolo. A CLI de Fala salva uma nova configuração em um novo ./spx/data subdiretório criado no diretório de trabalho atual para a CLI de Fala. A CLI de Fala procura primeiro um valor de configuração no diretório de trabalho atual, depois no armazenamento de dados em e, em seguida, em ./spx/dataoutros armazenamentos de dados, incluindo um armazenamento de dados somente leitura final no spx binário.

No início rápido da CLI de fala, você usou o armazenamento de dados para salvar seus @key valores e @region , portanto, não foi necessário especificá-los com cada spx comando. Lembre-se de que você pode usar arquivos de configuração para armazenar suas próprias definições de configuração ou até mesmo usá-los para passar URLs ou outro conteúdo dinâmico gerado em tempo de execução.

Para obter mais detalhes sobre arquivos de armazenamento de dados, incluindo o uso de arquivos de configuração padrão (@spx.default, , @default.confige @*.default.config para configurações padrão específicas do comando), digite este comando:

spx help advanced setup

NoDefaults

O exemplo a seguir limpa o @my.defaults arquivo de configuração, adiciona pares chave-valor para chave e região no arquivo e usa a configuração em uma chamada para spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Configuração dinâmica

Você também pode gravar conteúdo dinâmico em um arquivo de configuração usando a --output opção.

Por exemplo, o comando a seguir cria um modelo de fala personalizado e armazena a URL do novo modelo em um arquivo de configuração. O próximo comando aguarda até que o modelo nessa URL esteja pronto para uso antes de retornar.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

O exemplo a seguir grava duas URLs no @my.datasets.txt arquivo de configuração. Nesse cenário, --output pode incluir uma palavra-chave add opcional para criar um arquivo de configuração ou acrescentar ao existente.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Configuração SPX adicionar

Para legibilidade, flexibilidade e conveniência, você pode usar uma configuração predefinida com opções de saída selecionadas.

Por exemplo, você pode ter os seguintes requisitos para legendas:

Reconhecer a partir do arquivo caption.this.mp4de entrada .
Saída WebVTT e SRT legendas para os arquivos caption.vtt e caption.srt respectivamente.
Envie o , , durationresultid, e text de cada evento de reconhecimento para o offsetarquivoeach.result.tsv.

Você pode criar uma configuração predefinida nomeada @caption.defaults como mostrado aqui:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

As configurações são salvas no diretório atual em um arquivo chamado caption.defaults. Aqui está o conteúdo do arquivo:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Em seguida, para gerar legendas, você pode executar este comando que importa configurações da @caption.defaults configuração predefinida:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

Usar a configuração predefinida como mostrado anteriormente é semelhante à execução do seguinte comando:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Próximos passos

Operações em lote com a CLI de fala

Partilhar via