Поделиться через


Краткое руководство. Настраиваемая сводка (предварительная версия)

Используйте эту статью, чтобы приступить к созданию пользовательского проекта сводки, где можно обучать пользовательские модели на основе суммирования. Модель представляет собой программный продукт с функциями искусственного интеллекта, обученный для выполнения определенной задачи. Для этой системы модели суммируют текст и обучаются путем обучения из импортированных данных.

В этой статье мы используем Language Studio для демонстрации ключевых понятий пользовательской суммирования. В качестве примера мы создадим пользовательскую модель сводных данных для извлечения расположения объекта или лечения из коротких заметок о разгрузке.

Необходимые компоненты

Создание нового ресурса языка ИИ Azure и учетной записи хранения Azure

Прежде чем использовать настраиваемую сводку, необходимо создать ресурс языка искусственного интеллекта Azure, который предоставит учетные данные, необходимые для создания проекта и начала обучения модели. Кроме того, вам потребуется учетная запись хранения Azure, чтобы отправить в нее набор данных, который будет использоваться для создания модели.

Внимание

Чтобы быстро приступить к работе, рекомендуется создать новый ресурс языка искусственного интеллекта Azure, выполнив действия, описанные в этой статье. Эти действия помогут одновременно создать ресурс службы "Язык" и учетную запись хранения, так как проще сделать это сейчас, чем потом.

Создание ресурса на портале Azure

  1. Перейдите к портал Azure, чтобы создать новый ресурс языка искусственного интеллекта Azure.

  2. В появившемся окне выберите эту службу из настраиваемых функций. Нажмите кнопку "Продолжить", чтобы создать ресурс в нижней части экрана.

    Снимок экрана: настраиваемая классификация текста и распознавание именованных сущностей в портал Azure.

  3. Создайте ресурс службы "Язык" с приведенными ниже сведениями.

    Имя Описание
    Подписка Вашу подписку Azure.
    Группа ресурсов Группа ресурсов, которая будет содержать ваш ресурс. Можно использовать существующую группу или создать новую.
    Область/регион Регион для ресурса службы "Язык". Например, "Западная часть США 2".
    Имя. Имя ресурса.
    Ценовая категория Ценовая категория ресурса Языка. Вы можете использовать уровень "Бесплатный" (F0), чтобы поработать со службой.

    Примечание.

    Если появится сообщение Ваша учетная запись входа не является владельцем выбранной группы ресурсов учетной записи хранения, значит, ваша учетная запись должна иметь роль владельца, назначенную группе ресурсов, — только тогда вы сможете создать ресурс службы "Язык". Обратитесь за помощью к владельцу подписки Azure.

  4. В разделе этой службы выберите существующую учетную запись хранения или выберите новую учетную запись хранения. Эти значения для учетной записи хранения помогут вам быстро начать работу, но они не всегда подходят для реальных рабочих сред. Чтобы избежать задержек при создании проекта, подключитесь к учетным записям хранения в том же регионе, что и ресурс Языка.

    Значение для учетной записи хранения Рекомендуемое значение
    Storage account name Любое имя
    Storage account type Standard LRS
  5. Убедитесь, что флажок Уведомление об ответственном применении ИИ установлен. В нижней части страницы щелкните Просмотр и создание, а затем нажмите Создать.

Загрузка примера данных

Если вам нужны примеры данных, мы предоставили некоторые из них для сценариев сводных данных и бесед для этого краткого руководства.

Отправка примера данных в контейнер BLOB-объектов

  1. Поиск файлов для отправки в учетную запись хранения

  2. На портале Azure перейдите к созданной учетной записи хранения и выберите ее.

  3. В учетной записи хранения в меню слева выберите Контейнеры под пунктом Хранилище данных. На появившемся экране нажмите + Контейнер. Присвойте контейнеру имя example-data и оставьте Уровень общего доступа, установленный по умолчанию.

    Снимок экрана: главная страница учетной записи хранения.

  4. Когда контейнер будет создан, выберите его. Затем нажмите кнопку "Отправить", чтобы выбрать .txt скачанные ранее файлы..json

    Снимок экрана: кнопка для отправки файлов в учетную запись хранения.

Создание пользовательского проекта сводных данных

После настройки ресурса и учетной записи хранения создайте новый пользовательский проект сводки. Проект — это рабочая область для создания настраиваемых моделей машинного обучения на основе данных. Получить доступ к вашему проекту можете только вы и другие пользователи, у которых есть доступ к используемому ресурсу службы "Язык".

  1. Войдите в Студию Языка. Появится окно, где можно выбрать свою подписку и ресурс служб "Язык". Выберите ресурс службы "Язык", созданный на предыдущем шаге.

  2. Выберите функцию, которую вы хотите использовать в Language Studio.

  3. Щелкните Create new project (Создать новый проект) в меню в верхней части страницы проектов. Создание проекта позволяет помечать данные, обучать, оценивать, улучшать и развертывать модели.

    Снимок экрана: страница создания проекта.

  4. Введите сведения о проекте, включая имя, описание и язык файлов в проекте. Если вы используете пример набора данных, выберите английский язык. Вы не можете изменить имя проекта позже. Выберите Далее

    Совет

    Набор данных не обязательно должен быть полностью на одном языке. У вас может быть несколько документов с разными поддерживаемыми языками. Если набор данных содержит документы с разными языками или если во время выполнения предполагается использовать тексты на разных языках, выберите параметр Включить многоязычный набор данных при вводе основных сведений о проекте. Этот параметр можно включить позже на странице Параметры проекта.

  5. После нажатия кнопки "Создать проект" откроется окно, чтобы подключить учетную запись хранения. Если вы уже подключили учетную запись хранения, отобразится подключенная учетная запись хранения. Если нет, выберите учетную запись хранения в раскрывающемся списке и выберите Подключение учетную запись хранения. Это позволит задать необходимые роли для учетной записи хранения. На этом шаге может появиться ошибка, если вы не назначены в качестве владельца учетной записи хранения.

    Примечание.

    • Этот шаг нужно выполнить только один раз для каждого нового используемого ресурса.
    • Этот процесс необратим. Если учетная запись хранения будет подключена к ресурсу службы "Язык", ее нельзя будет отключить позже.
    • Вы можете подключить ресурс службы "Язык" только к одной учетной записи хранения.
  6. Выберите контейнер, в который отправили набор данных.

  7. Если вы уже помечены данные, убедитесь, что он соответствует поддерживаемму формату и выберите "Да", мои файлы уже помечены, и я отформатировал файл меток JSON и выберите файл меток в раскрывающемся меню. Выберите Далее. Если вы используете набор данных из краткого руководства, нет необходимости просматривать форматирование файла меток JSON.

  8. Проверьте введенные данные и щелкните Create Project (Создать проект).

Обучение модели

После создания проекта вы начните обучение модели.

Чтобы начать обучение модели в студии службы "Язык", сделайте следующее:

  1. Выберите элемент Задания обучения в меню слева.

  2. В верхнем меню выберите Запустить задание на обучение.

  3. Щелкните Train a new model (Обучить новую модель) и введите имя модели в текстовое поле. Можно также перезаписать существующую модель. Для этого выберите соответствующий параметр и укажите модель, которую требуется перезаписать, в раскрывающемся меню. Перезапись обученной модели необратима, но это не повлияет на развернутые модели до тех пор, пока вы не развернете новую модель.

    Создание задания на обучение

  4. По умолчанию система разделит помеченные данные между наборами обучения и тестирования в соответствии с указанными процентами. Если у вас есть документы в наборе тестирования, вы можете вручную разделить данные обучения и тестирования.

  5. Нажмите кнопку Обучить.

  6. Если выбрать идентификатор задания обучения из списка, на боковой панели появится область, где можно проверка ход обучения, состояние задания и другие сведения для этого задания.

    Примечание.

    • Модели будут создаваться только с помощью успешно завершенных заданий обучения.
    • Обучение может занять от нескольких минут до нескольких часов в зависимости от размера данных с метками.
    • В каждый момент времени может выполняться только одно задание на обучение. Нельзя запустить другое задание обучения в том же проекте до тех пор, пока не будет завершено выполнение задания.

Развертывание модели

Как правило, после обучения модели вы просмотрите его сведения об оценке и при необходимости внесите улучшения. В этом кратком руководстве вы просто развернете модель и сделаете ее доступной для вас в Языковой студии.

Чтобы развернуть модель в студии службы "Язык", выполните следующие действия.

  1. В меню слева выберите Развертывание модели.

  2. Выберите " Добавить развертывание", чтобы запустить новое задание развертывания.

    Снимок экрана: кнопка развертывания

  3. Выберите Создать развертывание, чтобы создать развертывание и назначить обученную модель из раскрывающегося списка ниже. Можно также выбрать вариант Overwrite an existing deployment (Перезаписать существующее развертывание) и выбрать обученную модель, которую требуется назначить развертыванию, в раскрывающемся списке ниже.

    Примечание.

    Для перезаписи существующего развертывания не требуется вносить изменения в вызов API прогнозирования, но после этого вы будете получать результаты от новой назначенной модели.

    Снимок экрана: экран развертывания

  4. Выберите "Развернуть" , чтобы запустить задание развертывания.

  5. После успешного развертывания рядом с ним появится дата окончания срока действия. Срок действия развертывания — когда развернутая модель будет недоступна для прогнозирования, которая обычно происходит через двенадцать месяцев после истечения срока действия конфигурации обучения.

Тестирование модели

В этом кратком руководстве вы будете использовать Language Studio для отправки пользовательской задачи сводных данных и визуализации результатов. Загруженный ранее пример набора данных содержит некоторые тестовые документы, которые можно использовать на этом шаге.

Чтобы протестировать развернутые модели в Language Studio, выполните следующие действия.

  1. В меню слева выберите Testing deployments (Тестирование развертываний).

  2. Выберите развертывание, которое нужно протестировать. Можно тестировать только модели, назначенные развертываниям.

  3. Для многоязычных проектов выберите язык тестируемого текста из раскрывающегося списка языков.

  4. Выберите развертывание, которое требуется запросить или протестировать, из раскрывающегося списка.

  5. Введите текст, который требуется отправить в запросе, или отправьте файл .txt, который требуется использовать.

  6. Выберите "Запустить тест " в верхнем меню.

  7. На вкладке Result (Результат) можно просмотреть извлеченные из текста сущности и их типы. Вы также можете просмотреть ответ JSON на вкладке JSON.

Снимок экрана: результаты теста модели.

Очистка ресурсов

Если проект вам больше не нужен, вы можете удалить его с помощью Студии Языка. Выберите функцию, которую вы используете в верхней части, а затем выберите проект, который вы хотите удалить. Выберите "Удалить" из верхнего меню, чтобы удалить проект.

Следующие шаги