Configuración del almacén de datos de la CLI de Voz

Artículo
01/23/2024

La CLI de Voz utiliza los valores de los archivos de configuración, a los se puede hacer referencia mediante un símbolo @. La CLI de Voz guarda los valores nuevos en un subdirectorio ./spx/data nuevo que crea en el directorio de trabajo de la CLI de Voz. La CLI de Voz busca primero un valor de configuración en el directorio de trabajo actual, después en el almacén ./spx/datade datos en y, a continuación, en otros almacenes de datos, incluido un almacén de datos de solo lectura final en el spx binario.

En el inicio rápido de la CLI de Voz, ha usado el almacén de datos para guardar los @key valores y @region , por lo que no es necesario especificarlos con cada spx comando. Tenga en cuenta que puede usar los archivos de configuración para almacenar su propia configuración, o incluso para pasar direcciones URL o cualquier otro contenido dinámico que se haya generado en el runtime.

Para más información sobre los archivos del almacén de datos, incluido el uso de archivos de configuración predeterminados (@spx.default, @default.config y @*.default.config para la configuración predeterminada específica del comando), escriba este comando:

spx help advanced setup

nodefaults

En el ejemplo siguiente se borra el archivo de configuración @my.defaults, se agregan pares clave-valor para clave y región en el archivo, y se usa la configuración en una llamada a spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Configuración dinámica

En los archivos de configuración también se puede escribir contenido dinámico mediante la opción --output.

Por ejemplo, el siguiente comando crea un modelo de voz personalizado y almacena la dirección URL del mismo en un archivo de configuración. El siguiente comando espera hasta que el modelo de la dirección URL esté listo para su uso antes de volver.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

En el ejemplo siguiente se escriben dos direcciones URL en el archivo de configuración @my.datasets.txt. En este escenario, existe la opción de que --output incluya la palabra clave add para crear un archivo de configuración o anexarlo al existente.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Adición de configuración de SPX

Para mejorar la legibilidad, la flexibilidad y la comodidad, puede usar una configuración preestablecida con las opciones de salida seleccionados.

Por ejemplo, puede tener los siguientes requisitos para los subtítulos:

Reconocer desde el caption.this.mp4 del archivo de entrada.
Genera subtítulos de WebVTT y SRT en los archivos caption.vtt y caption.srt respectivamente.
Genera los valores offset, duration, resultid y text de cada evento de reconocimiento en el archivo each.result.tsv.

Puede crear una configuración preestablecida denominada @caption.defaults como se muestra aquí:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

La configuración se guarda en el directorio actual en un archivo denominado caption.defaults. A continuación, le mostramos el contenido del archivo:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Para generar subtítulos, puede ejecutar este comando que importa la configuración desde la configuración preestablecida de @caption.defaults:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

El uso de la configuración preestablecida como se muestra anteriormente es similar a ejecutar el siguiente comando:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Pasos siguientes

Operaciones por lotes con la CLI de Voz

Configuración del almacén de datos de la CLI de Voz

nodefaults

Configuración dinámica

Adición de configuración de SPX

Pasos siguientes

Recursos adicionales