Configurare l'archivio dati dell'interfaccia della riga di comando di Voce

Articolo
01/23/2024

L'interfaccia della riga di comando di Voce può basarsi sulle impostazioni nei file di configurazione, a cui è possibile fare riferimento usando un @ simbolo. L'interfaccia della riga di comando di Voce salva una nuova impostazione in una nuova sottodirectory ./spx/data che viene creata nella directory di lavoro corrente per l'interfaccia della riga di comando di Voce. L'interfaccia della riga di comando di Voce cerca innanzitutto un valore di configurazione nella directory di lavoro corrente, quindi nell'archivio dati in ./spx/datae quindi in altri archivi dati, incluso un archivio dati di sola lettura finale nel spx file binario.

Nella guida introduttiva all'interfaccia della riga di comando di Voce è stato usato l'archivio dati per salvare i @key valori e @region , quindi non è necessario specificarli con ogni spx comando. Tenere presente che è possibile usare i file di configurazione per archiviare le proprie impostazioni di configurazione o persino per passare URL o altri contenuti dinamici generati in fase di esecuzione.

Per informazioni dettagliate sui file di archivio dati, incluso l'utilizzo dei file di configurazione predefiniti (@spx.default, @default.config e @*.default.config per le impostazioni predefinite specifiche dei comandi), immettere questo comando:

spx help advanced setup

nodefaults

Nell'esempio seguente viene cancellato il file di configurazione @my.defaults, vengono aggiunte coppie chiave-valore per chiave e area nel file e viene usata la configurazione in una chiamata a spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Configurazione dinamica

È anche possibile scrivere contenuto dinamico in un file di configurazione usando l'opzione --output .

Il comando seguente ad esempio crea un modello di conversione voce/testo personalizzato e archivia l'URL del nuovo modello in un file di configurazione. Il comando successivo attende fino a quando il modello in tale URL non è pronto per l'uso prima di restituire il risultato.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

L'esempio seguente esegue la scrittura di due URL nel file di configurazione @my.datasets.txt. In questo scenario, --output può includere una parola chiave add facoltativa per creare un file di configurazione o accodarlo a quello esistente.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Aggiunta della configurazione SPX

Per la leggibilità, la flessibilità e la praticità, è possibile usare una configurazione predefinita con le opzioni di output selezionate.

Ad esempio, potrebbero essere previsti i requisiti seguenti per didascalia:

Riconoscere dal file di caption.this.mp4input .
I didascalia WebVTT e SRT di output rispettivamente nei filecaption.vtt.caption.srt
Restituire l'output di offset, duration, resultide text di ogni evento di riconoscimento nel file each.result.tsv.

È possibile creare una configurazione predefinita denominata @caption.defaults come illustrato di seguito:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

Le impostazioni vengono salvate nella directory corrente in un file denominato caption.defaults. Ecco il contenuto del file:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Quindi, per generare didascalia, è possibile eseguire questo comando che importa le impostazioni dalla @caption.defaults configurazione predefinita:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

L'uso della configurazione predefinita come illustrato in precedenza è simile all'esecuzione del comando seguente:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Passaggi successivi

Operazioni in batch con l'interfaccia della riga di comando di Voce

Configurare l'archivio dati dell'interfaccia della riga di comando di Voce

nodefaults

Configurazione dinamica

Aggiunta della configurazione SPX

Passaggi successivi

Risorse aggiuntive