Configurer le magasin de données Speech CLI

Article
01/23/2024

L’interface CLI Speech peut s’appuyer sur les paramètres des fichiers de configuration, que vous pouvez référencer à l’aide d’un symbole @. L’interface CLI Speech enregistre un nouveau paramètre dans un nouveau sous-répertoire ./spx/data créé dans le répertoire de travail actuel de l’interface CLI Speech. L’interface CLI Speech recherche d’abord une valeur de configuration dans votre répertoire de travail actuel, puis dans le magasin de données à l’adresse ./spx/data, puis dans d’autres magasins de données, y compris un magasin de données en lecture seule final dans le spx fichier binaire.

Dans le guide de démarrage rapide de l’interface CLI Speech, vous avez utilisé le magasin de données pour enregistrer vos @key valeurs @region . Vous n’avez donc pas besoin de les spécifier avec chaque spx commande. N’oubliez pas que vous pouvez utiliser des fichiers de configuration pour stocker vos propres paramètres de configuration, voire même pour passer des URL ou d’autres contenus dynamiques générés au moment de l’exécution.

Pour plus d’informations sur les fichiers de magasin de données, notamment sur l’utilisation des fichiers de configuration par défaut (@spx.default, @default.configet @*.default.config pour les paramètres par défaut propres à une commande), entrez la commande suivante :

spx help advanced setup

nodefaults

L’exemple suivant efface le fichier de configuration @my.defaults, ajoute des paires clé-valeur pour key et region dans le fichier et utilise la configuration dans un appel à spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Configuration dynamique

Vous pouvez également écrire du contenu dynamique dans un fichier de configuration à l’aide de l’option --output.

Par exemple, la commande suivante crée un modèle vocal personnalisé et stocke l’URL du nouveau modèle dans un fichier de configuration. La commande suivante attend que le modèle défini à cette URL soit prêt à être utilisé pour passer la main.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

L’exemple suivant écrit deux URL dans le fichier de configuration @my.datasets.txt. Dans ce scénario, --output peut inclure un mot clé add facultatif pour créer un fichier de configuration ou compléter l’existant.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Ajout de la configuration SPX

Pour des raisons de lisibilité, de flexibilité et de commodité, vous pouvez utiliser une configuration prédéfinie avec certaines options de sortie.

Par exemple, vous pouvez avoir les conditions requises suivantes pour lesous-titrage :

Effectuer une reconnaissance à partir du fichier d’entrée caption.this.mp4.
Générer les sous-titres WebVTT et SRT dans des fichiers caption.vtt et caption.srt respectivement.
Générer les offset, duration, resultid et text de chaque événement de reconnaissance dans le fichier each.result.tsv.

Vous pouvez créer une configuration prédéfinie nommée @caption.defaults comme illustrée ici :

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

Les paramètres sont enregistrés dans le répertoire actif dans un fichier nommé caption.defaults. Voici le contenu du fichier :

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Ensuite, pour générer des sous-titres, vous pouvez exécuter cette commande qui importe les paramètres de la configuration prédéfinie @caption.defaults :

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

L’utilisation de la configuration prédéfinie affichée précédemment revient à exécuter la commande suivante :

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Étapes suivantes

Opérations de traitement par lots avec l’interface CLI Speech

Configurer le magasin de données Speech CLI

nodefaults

Configuration dynamique

Ajout de la configuration SPX

Étapes suivantes

Ressources supplémentaires