Настройка языковой модели с помощью веб-сайта Индексатора видео Azure AI

Внимание

Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.

Индексатор видео Azure позволяет создавать пользовательские языковые модели для настройки распознавания речи путем отправки текста адаптации, а именно текста из домена, словарь которого вы хотите адаптировать подсистему. Как только вы обучите свою модель, новые слова, появляющиеся в тексте адаптации, будут распознаваться.

Подробные сведения и рекомендации по пользовательским языковым моделям см. в статье "Настройка языковой модели с помощью индексатора видео Azure AI".

Вы можете использовать веб-сайт Индексатора видео Azure для создания и редактирования пользовательских языковых моделей в вашей учетной записи, как описано в этом разделе. Кроме того, вы можете применять API, как описано в этой статье.

Создание языковой модели

  1. Перейдите на веб-сайт Индексатора видео Azure ИИ и войдите в систему.

  2. Чтобы настроить модель в учетной записи, в левой части страницы нажмите кнопку Настройка модели содержимого.

    Настройка con режим палатки l в Индексаторе видео в Azure AI

  3. Выберите вкладку Язык.

    Откроется список поддерживаемых языков.

  4. Под требуемым языком выберите Добавить модель.

  5. Введите имя языковой модели и нажмите клавишу ВВОД.

    На этом этапе будет создана модель, и у вас появится возможность передавать в нее текстовые файлы.

  6. Чтобы добавить текстовый файл, выберите Добавить файл. Откроется обозреватель файлов.

  7. Перейдите к текстовому файлу и выберите его. Вы можете добавить несколько текстовых файлов в языковую модель.

    Вы также можете добавить текстовый файл, нажав кнопку ... справа от языковой модели и выбрав Добавить файл.

  8. После передачи текстовых файлов нажмите кнопку Обучить зеленого цвета.

Процесс обучения может занять несколько минут. По завершении рядом с моделью появится значение состояния Trained (Обученная). Вы можете просматривать, скачивать и удалять файл из модели.

Обучение модели

Использование языковой модели в новом видео

Чтобы применить языковую модель к новому видео, выполните одно из действий, описанных ниже.

  • Нажмите кнопку Передать в верхней части страницы.

    Кнопка

  • Перетащите аудио- или видеофайл или перейдите к своему файлу.

Вам будет предоставлена возможность выбрать исходный язык видео. Откройте раскрывающийся список и выберите созданную языковую модель. В ней должны быть указаны язык вашей языковой модели и заданное имя в скобках. Например:

Выбор языка источника видео— Повторное использование видео с помощью Индексатора видео Azure AI

Выберите параметр Передать в нижней части страницы, и новое видео будет проиндексировано с использованием вашей языковой модели.

Повторная индексация с помощью языковой модели

Чтобы использовать языковую модель для повторной индексации видео в коллекции, выполните указанные ниже действия.

  1. Войдите на домашнюю страницу Индексатора видео Azure AI.
  2. Нажмите кнопку ... на видео и выберите пункт Повторное индексирование.
  3. Вы сможете выбрать исходный язык видео, который будет использоваться для повторной индексации. Откройте раскрывающийся список и выберите созданную языковую модель. В ней должны быть указаны язык вашей языковой модели и заданное имя в скобках.
  4. Нажмите кнопку Повторная индексация, и видео будет повторно проиндексировано с использованием вашей языковой модели.

Изменение языковой модели

Вы можете отредактировать языковую модель, изменив ее имя, добавив в нее файлы и удалив их из нее.

Если вы добавляете или удаляете файлы из языковой модели, потребуется повторно обучить ее, нажав зеленую кнопку Обучить.

Переименование языковой модели

Чтобы изменить имя языковой модели, нажмите кнопку ... справа от нее и выберите Переименовать.

Введите новое имя и нажмите клавишу ВВОД.

Добавление файлов

Чтобы добавить текстовый файл, выберите Добавить файл. Откроется обозреватель файлов.

Перейдите к текстовому файлу и выберите его. Вы можете добавить несколько текстовых файлов в языковую модель.

Чтобы добавить текстовый файл, нажмите кнопку ... справа от языковой модели и выберите Добавить файл.

Удаление файлов

Чтобы удалить файл из языковой модели, нажмите кнопку ... справа от текстового файла и выберите Удалить. Появится новое окно с сообщением о том, что удаление невозможно отменить. Выберите пункт Удалить в новом окне.

Это действие полностью удалит файл из языковой модели.

Удаление языковой модели

Чтобы удалить языковую модель из учетной записи, нажмите кнопку ... справа от модели и выберите Удалить.

Появится новое окно с сообщением о том, что удаление невозможно отменить. Выберите пункт Удалить в новом окне.

Это действие полностью удалит языковую модель из вашей учетной записи. В любом видео, в котором использовалась удаленная языковая модель, тот же индекс сохранится до тех пор, пока видео не будет индексировано повторно. Если видео было повторно индексировано, то ему можно назначить новую языковую модель. В противном случае индексатор видео Azure AI будет использовать свою модель по умолчанию для повторного анализа видео.

Настройка языковых моделей путем исправления произносимого текста

Индексатор видео Azure AI поддерживает автоматическую настройку языковых моделей на основе фактических исправлений, внесенных пользователями в транскрибирование видео.

  1. Чтобы внести исправления в расшифровку, откройте видео, которое требуется изменить, из видео в учетной записи. Перейдите на вкладку Временная шкала.

    Настройка языковой модели временная шкала вкладки —Индексатор видео Azure AI

  2. Щелкните значок с изображением карандаша, чтобы изменить произносимый текст.

    Настройка изменения транскрибирования языковой модели — индексатор видео Azure AI

    Индексатор видео Azure AI записывает все строки, исправленные вами в транскрибировании видео, и автоматически добавляет их в текстовый файл с именем "Из редактирования расшифровки". Эти изменения применяются для повторного обучения конкретной языковой модели, которая использовалась для индексирования этого видео.

    Также включаются изменения, выполненные на временной шкале мини-приложения.

    Если при индексировании этого видео языковая модель не указана, все изменения для него будут сохранены в языковой модели по умолчанию под названием "Адаптация учетных записей" для определенного языка видео.

    Если в одну и ту же строку внесено несколько изменений, для обновления языковой модели будет использоваться только последняя версия исправленной строки.

    Примечание.

    Для настройки используются только текстовые исправления. Исправления, не затрагивающие реальные слова (например, знаки пунктуации и пробелы), не включаются.

  3. Исправления в расшифровке будут отображаться на вкладке "Язык" страницы "Настройка модели содержимого".

    Чтобы просмотреть файл "Из изменений в расшифровке" для каждой языковой модели, выберите его, чтобы открыть.

    Изменение расшифровки — Индексатор видео Azure AI