Ресурсы Azure для QnA Maker
QnA Maker использует несколько источников Azure, каждый из которых имеет собственное назначение. Понимание того, как они используются отдельно, позволяет планировать и выбрать правильную ценовую категорию или знать, когда нужно изменить ценовую категорию. Понимание того, как они используются в сочетании, позволяет находить и устранять проблемы при их возникновении.
Примечание.
Поддержка службы QnA Maker будет прекращена 31 марта 2025 г. Новая версия вопроса и возможности ответа теперь доступна как часть языка искусственного интеллекта Azure. Сведения о возможностях ответов на вопросы в службе Языка см. в статье с ответами на вопросы. С 1 октября 2022 г. вы не сможете создавать ресурсы QnA Maker. Сведения о переносе существующих баз знаний QnA Maker в функцию вопросов и ответов см. в руководстве по миграции.
Планирование ресурсов
При первой разработке базы знаний QnA Maker на этапе прототипа обычно используется один ресурс QnA Maker для тестирования и работы.
При переходе на этап разработки проекта следует учитывать следующее.
- Сколько языков будет храниться в системе базы знаний?
- В скольких регионах будет доступна база знаний?
- Сколько документов по каждой из предметных областей будет храниться в системе?
Запланируйте наличие одного ресурса QnA Maker, на котором будут содержаться все базы знаний с сочетанием одних и тех же языка, региона и предметной области.
Рекомендации по ценовым категориям
Обычно необходимо учитывать три параметра:
Требуемая пропускная способность службы:
- выберите соответствующий план приложений для службы приложений с учетом требований. Масштаб приложения можно увеличить или уменьшить.
- Это также повлияет на выбор номера SKU Когнитивного поиска Azure. Дополнительные сведения см. здесь. Кроме того, может потребоваться изменить емкость Когнитивного поиска с помощью реплик.
Размер и количество баз знаний: выберите соответствующий номер SKU Поиска Azure для вашего сценария. Как правило, выбор необходимого количества баз знаний зависит от количества разных предметных областей. Для одной предметной области (для одного языка) следует использовать одну предметную область.
Ресурс службы поиска Azure должен быть создан после января 2019 и не может находиться на бесплатном (общем) уровне. В портале Azure не поддерживается настройка ключей, управляемых клиентом.
Внимание
На определенном уровне можно опубликовать N-1 баз знаний, где N — максимальное разрешенное на этом уровне количество индексов. Также проверьте максимальный размер и количество документов, разрешенные для каждого уровня.
Например, если для уровня допускается 15 индексов, можно опубликовать 14 баз знаний (один индекс для каждой опубликованной базы знаний). Пятнадцатый индекс используется для разработки и тестирования всех баз знаний.
- Количество документов в качестве источников: SKU службы управления QnA Maker ценовой категории "Бесплатный" разрешает управлять через портал и API-интерфейсы только тремя документами размером 1 МБ каждый. Номер SKU уровня "Стандартный"не имеет ограничений на число документов, которыми можно управлять. Дополнительные сведения см. здесь.
В следующей таблице приведен ряд общих рекомендаций.
Управление службой QnA Maker | Служба приложений | Поиск с использованием ИИ Azure | Ограничения | |
---|---|---|---|---|
Экспериментирование | Номер SKU уровня "Бесплатный" | Уровень "Бесплатный" | Уровень "Бесплатный" | Публикация до 2 баз знаний размером 50 Мбайт |
Среда разработки и тестирования | SKU "Стандартный" | Совмещаемая блокировка | Базовая | Публикация до 14 баз знаний размером 2 ГБ |
Рабочая среда | SKU "Стандартный" | Basic | Standard | Публикация до 49 баз знаний размером 25 Гбайт |
Рекомендуемые параметры
Целевое значение QPS | Служба приложений | Поиск с использованием ИИ Azure |
---|---|---|
3 | S1, одна реплика | S1, одна реплика |
50 | S3, 10 реплик | S1, 12 реплик |
80 | S3, 10 реплик | S3, 12 реплик |
100 | P3V2, 10 реплик | S3, 12 реплик, 3 раздела |
200–250 | P3V2, 20 реплик | S3, 12 реплик, 3 раздела |
Изменение ценовой категории
Обновление | Причина |
---|---|
Обновление номера SKU для управления службой QnA Maker | В базе знаний требуется больше пар "вопрос/ответ" или источников документов. |
Обновите номер SKU Служба приложений и проверьте уровень поиска ИИ Azure и создайте реплики Когнитивного поиска | База знаний должна обслуживать больше запросов из клиентского приложения, например из чат-бота. |
Обновление azure AI служба | Вы планируете использовать несколько баз знаний. |
Получите последние обновления среды выполнения, обновив Службу приложений на портале Azure.
Ключи в QnA Maker
В службе QnA Maker используется два типа ключей: ключи разработки и ключи конечной точки запроса, которые используются со средой выполнения, размещенной в Службе приложений.
Используйте эти ключи при выполнении запросов к службе через API.
Имя. | Расположение | Характер использования |
---|---|---|
Ключ разработки/подписки | Портал Azure | используются для доступа к API службы управления QnA Maker. Эти API позволяют редактировать вопросы и ответы в базе знаний и публиковать базу знаний. Эти ключи создаются при создании новой службы QnA Maker. Найдите эти ключи на ресурсе служб ИИ Azure на странице "Ключи" и " Конечная точка ". |
Ключ конечной точки запроса | Портал QnA Maker | Эти ключи используются для запроса конечной точки опубликованной базы знаний, чтобы получить ответ на вопрос. Эта конечная точка запроса обычно используется в коде чат-бота или клиентского приложения, подключающегося к службе QnA Maker. Эти ключи создаются при публикации базы знаний QnA Maker. Они находятся на странице Параметры службы. Перейти к этой странице можно в раскрывающемся меню в правой верхней части страницы. |
Поиск ключей разработки на портале Azure
Ключи разработки можно просмотреть и сбросить на портале Azure, где был создан ресурс QnA Maker.
Перейдите к ресурсу QnA Maker в портал Azure и выберите ресурс, имеющий тип служб ИИ Azure:
Выберите Ключи и конечная точка:
Поиск ключей конечной точки запроса на портале QnA Maker
Конечная точка находится в том же регионе, что и ресурс, поскольку ключи конечной точки используются для выполнения вызова к базе знаний.
Ключами конечной точки можно управлять на портале QnA Maker.
Войдите на портал QnA Maker, перейдите в свой профиль и выберите Параметры службы.
Просмотрите или сбросьте свои ключи.
Примечание.
Если вы подозреваете, что ключи были скомпрометированы, обновите их. Для этого может потребоваться внести соответствующие изменения в код клиентского приложения или бота.
Регион службы управления
Служба управления QnA Maker используется только для портала QnA Maker и для первоначальной обработки данных. Она доступна только в регионе Западная часть США. В ней не хранятся данные клиентов.
Рекомендации по именованию ресурсов
Имя ресурса для ресурса QnA Maker, например qna-westus-f0-b
, также используется для именования других ресурсов.
В окне создания на портале Azure можно создать ресурс QnA Maker и выбрать ценовые категории для других ресурсов.
После того как ресурсы созданы, они имеют одно и то же имя, за исключением необязательного ресурса Application Insights, который добавляет символы в имя.
Совет
Создайте новую группу ресурсов при создании ресурса QnA Maker. Это позволит просматривать все ресурсы, связанные с ресурсом QnA Maker при поиске по группе ресурсов.
Совет
Используйте соглашение об именовании, чтобы указать ценовые категории в имени ресурса или группы ресурсов. При возникновении ошибок при создании новой базы знаний или добавлении новых документов распространенной проблемой является ограничение ценовой категории Когнитивного поиска.
Назначение ресурсов
Каждый ресурс Azure, созданный с помощью QnA Maker, имеет определенное назначение.
- Ресурс QnA Maker
- Ресурс Когнитивного поиска
- Служба приложений
- Служба плана приложений
- Службы Application Insights
Ресурс QnA Maker
Ресурс QnA Maker предоставляет доступ к API разработки и публикации.
Параметры конфигурации ресурса QnA Maker
При создании базы знаний на портале QnA Maker параметр Язык является единственным параметром, который применяется на уровне ресурса. Язык выбирается при создании первой базы знаний для ресурса.
Ресурс Когнитивного поиска
Ресурс Когнитивного поиска используется для следующего.
- Хранение пар "вопрос/ответ"
- Указание начального ранжирования (ранжировщик № 1) для пар "вопрос/ответ" во время выполнения
Использование индексов
Ресурс хранит один индекс в качестве тестового индекса, а оставшиеся индексы сопоставляются с одной опубликованной базой знаний.
На ресурсе, оплаченном для хранения 15 индексов, будет содержаться 14 опубликованных баз знаний, а один индекс используется для тестирования всех баз знаний. Этот индекс для тестирования секционируется базой знаний, чтобы запрос, использующий интерактивную область тестирования, использовал этот индекс, но возвращал только результаты из определенной секции, связанной с определенной базой знаний.
Использование языка
Первая база знаний, созданная в ресурсе QnA Maker, используется для определения одного языкового набора и для ресурса Когнитивного поиска и всех его индексов. Для службы QnA Maker можно использовать только один языковой набор.
Использование одной службы Когнитивного поиска
Если вы создаете службу QnA и ее зависимости (например, "Поиск") на портале, служба "Поиск" создается и связывается со службой QnA Maker. После создания этих ресурсов можно обновить параметр "Службы приложений", чтобы использовать ранее существующую службу поиска, и удалить только что созданную.
Узнайте , как настроить QnA Maker для использования другого ресурса службы искусственного интеллекта Azure, отличного от ресурса, созданного в рамках процесса создания ресурсов QnA Maker.
Служба приложений и план службы приложений
Служба приложений используется вашим клиентским приложением для доступа к опубликованным базам знаний посредством конечной точки среды выполнения. В Службу приложений входит второй слой ранжирования (ранжирование 2) для пар "вопрос–ответ" в среде выполнения на основе обработки естественного языка (NLP). Второй ранжировщик применяет интеллектуальные фильтры, которые могут включать метаданные и дальнейшие подсказки.
Для отправки запроса к опубликованной базе знаний все опубликованные базы знаний используют одну и ту же конечную точку URL-адреса, но в маршруте указывают идентификатор базы знаний.
{RuntimeEndpoint}/qnamaker/knowledgebases/{kbId}/generateAnswer
Application Insights
Application Insights используется для сбора журналов чатов и данных телеметрии. Ознакомьтесь с общими запросами Kusto для получения сведений о службе.
Предоставление QnA Maker общего доступа к службам
QnA Maker создает несколько ресурсов Azure. Чтобы упростить управление и воспользоваться преимуществами разделения затрат, используйте следующую таблицу, чтобы понять, чем можно поделиться, а чем — нет:
Service | Поделиться | Причина |
---|---|---|
Службы ИИ Azure | X | Невозможно в принципе |
План службы приложений | ✔ | Фиксированное дисковое пространство, выделенное для плана Службы приложений. Если другие приложения, использующие один план Службы приложений, используют значительное место на диске, в работе экземпляра Службы приложений QnAMaker возникнут проблемы. |
Служба приложений | X | Невозможно в принципе |
Application Insights | ✔ | Может быть в общем доступе. |
Служба "Поиск" | ✔ | 1. testkb является зарезервированным именем для службы QnAMaker; оно не может использоваться другими пользователями.2. Сопоставление синонимов по имени synonym-map зарезервировано для службы QnAMaker.3. Количество опубликованных баз знаний ограничено уровнем службы "Поиск". Если доступны свободные индексы, они могут использоваться другими службами. |
Следующие шаги
- Сведения о базе знаний QnA Maker
- Общие сведения о жизненном цикле базы знаний
- Проверка ограничений службы и базы знаний