Настройка хранилища данных интерфейса командной строки службы "Речь"

Интерфейс командной строки службы "Речь" определяется параметрами в файлах конфигурации, на которые можно ссылаться с помощью символа @. CLI службы "Речь" сохраняет новый параметр в новом подкаталоге ./spx/data, который создается в текущей рабочей папке для CLI службы "Речь". Интерфейс командной строки службы "Речь" сначала ищет значение конфигурации в текущем рабочем каталоге, а затем в хранилище ./spx/dataданных, а затем в других хранилищах данных, включая окончательное хранилище данных только для чтения в двоичном spx файле.

В кратком руководстве по интерфейсу командной строки службы "Речь" вы использовали хранилище данных для сохранения @key и @region значений, поэтому вам не нужно указывать их с каждой spx командой. Учитывайте, что файлы конфигурации можно также использовать для хранения собственных параметров конфигурации или даже для передачи URL-адресов либо другого динамического содержимого, созданного во время выполнения.

Для получения дополнительных сведений о файлах хранилища данных, включая использование файлов конфигурации по умолчанию (@spx.default, @default.config и @*.default.config для параметров по умолчанию конкретных команд), введите следующую команду:

spx help advanced setup

nodefaults

В следующем примере очищается файл конфигурации @my.defaults, в файле добавляются пары "ключ-значение" для key и region, а также используется конфигурация при вызове spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Динамическая конфигурация

Динамическое содержимое также можно записать в файл конфигурации, используя параметр --output.

Например, следующая команда создает пользовательскую модель речи и сохраняет URL-адрес новой модели в файле конфигурации. Следующая команда ожидает, пока модель по этому URL-адресу не будет готова к использованию, прежде чем вернуться.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

В следующем примере два URL-адреса записываются в файл конфигурации @my.datasets.txt. В этом сценарии --output может включать дополнительное ключевое слово add, чтобы создать файл конфигурации или добавить к имеющемуся.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Добавление конфигурации SPX

Для удобства чтения, гибкости и удобства можно использовать предустановленную конфигурацию с выбранными параметрами вывода.

Например, у вас могут быть следующие требования к субтитрам:

  • Распознать из входного файла caption.this.mp4.
  • Вывод субтитров WebVTT и SRT к файлам caption.vtt и caption.srt соответственно.
  • Вывод offset, duration, resultid и text каждого события распознавания в файл each.result.tsv.

Можно создать предустановленную конфигурацию с именем @caption.defaults, как показано здесь:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

Параметры сохраняются в текущем каталоге в файле с именем caption.defaults. Ниже приведено содержимое файла:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Затем, чтобы создать субтитры, можно выполнить следующую команду, которая импортирует параметры из предустановленной конфигурации @caption.defaults:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

Использование предустановленной конфигурации, как показано ранее, аналогично выполнению следующей команды:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Следующие шаги