Поделиться через


Создание служба ИИ Azure на портале

Поиск ИИ Azure — это платформа получения сведений для предприятия. Он поддерживает традиционный поиск и поиск на основе искусственного интеллекта на основе искусственного интеллекта для взаимодействия с вашими данными по поводу собственного содержимого.

Самый простой способ создать службу — использовать портал Azure, которая описана в этой статье.

Вы также можете использовать Azure PowerShell, Azure CLI, REST API управления, шаблон службы Azure Resource Manager, файл Bicep или Terraform.

Анимированный GIF-файл

Перед началом работы

В течение всего времени существования службы исправлено несколько свойств службы. Перед созданием службы определите имя, регион и уровень.

  • Имя службы становится частью конечной точки URL-адреса. Имя должно быть уникальным и должно соответствовать правилам именования.

  • Регион определяет расположение данных и доступность определенных функций. Семантическое ранжирование и интеграция СИ Azure соответствуют требованиям к регионам. Убедитесь, что выбранный регион поддерживает необходимые функции.

  • Уровень служб определяет инфраструктуру, ограничения служб и выставление счетов. Некоторые функции недоступны на более низких или специализированных уровнях.

Подписка (бесплатная или платная)

При создании ресурса в платной подписке Azure выполняется поиск по платной (или оплачиваемой) категории (базовый или более высокий).

Чтобы бесплатно попробовать поиск azure AI, откройте пробную подписку и создайте службу поиска, выбрав уровень "Бесплатный". Вы можете использовать одну бесплатную службу поиска для каждой подписки Azure. Бесплатные службы поиска предназначены для краткосрочной оценки продукта для непроизводственных приложений. Как правило, вы можете выполнить все краткие руководства и большинство учебников, за исключением тех, кто содержит семантический рейтинг (требуется оплачиваемая служба).

Кроме того, вы можете использовать бесплатные кредиты, чтобы попробовать платные службы Azure. С помощью этого подхода можно создать службу поиска на уровне "Базовый" или выше, чтобы получить больше емкости. С вашей кредитной карты не будет взиматься плата, если вы явно не измените параметры и не попросите снимать плату. Другим способом является активация кредитов Azure в подписке Visual Studio. В подписке Visual Studio каждый месяц зачисляются деньги на счет, которые можно использовать для оплаты служб Azure.

Поиск предложения "Поиск по искусственному интеллекту Azure"

  1. Войдите на портал Azure.

  2. Выберите (Создать ресурс") в левом верхнем углу.

  3. Используйте панель поиска, чтобы найти "Поиск ИИ Azure*".

Снимок экрана: страница

Выберите подписку

Если у вас есть несколько подписок, выберите ту, которую будете использовать. Если вы реализуете управляемое клиентом шифрование или используете другие функции, зависящие от удостоверений управляемых служб для доступа к внешним данным, выберите ту же подписку, что и для Azure Key Vault или других служб, для которых используются управляемые удостоверения.

Настройка группы ресурсов

Группа ресурсов — это контейнер, содержащий связанные ресурсы для решения Azure. Это полезно для консолидации ресурсов с тем же решением, затрат на мониторинг и проверки даты создания службы поиска.

Снимок экрана: страница

Со временем вы можете контролировать текущие и запланированные затраты, а также просматривать расходы по отдельным ресурсам. На следующем снимке экрана показан тип сведений о затратах, которые можно увидеть при объединении нескольких ресурсов в одну группу.

Снимок экрана: страница

Совет

Группы ресурсов упрощают очистку, так как удаление группы ресурсов удаляет все в нем.

Присвоение имени службе

В разделе сведений об экземпляре введите имя службы в поле URL-адрес. Имя является частью конечной точки, для которой выдаются вызовы API: https://your-service-name.search.windows.net Например, если вы хотите, чтобы конечная точка была https://myservice.search.windows.net, вы должны ввести myservice.

Требования к имени службы:

  • Уникальный в пространстве имен search.windows.net
  • От 2 до 60 символов длиной
  • Состоит из строчных букв, цифр или дефисов (-)
  • Не используйте дефисы в первых двух символах или в качестве последнего одного символа
  • Не используйте последовательные дефисы в любом месте

Совет

Если у вас несколько служб поиска, оно помогает включить регион (или расположение) в имя службы в качестве соглашения об именовании. Имя, например mysearchservice-westus , может сохранить поездку на страницу свойств при выборе способа объединения или присоединения ресурсов.

Выберите регион

Внимание

В связи с высоким спросом поиск Azure AI в настоящее время недоступен для новых экземпляров в Западной Европе. Если вам не нужно немедленно использовать семантический рангер или наборы навыков, выберите швецию Central, так как она имеет большую емкость центра обработки данных. В противном случае Северная Европа является еще одним вариантом. В настоящее время существуют также ограничения емкости для уровней "Базовый" и "Стандартный" (S1) в заданном регионе.

Если вы используете несколько служб Azure, поместите их в один регион с минимальными или пустыми платами за пропускную способность. Плата за исходящий трафик данных между службами одного региона не взимается.

Как правило, выберите регион рядом с вами, если не применяются следующие рекомендации:

  • Ближайший регион ограничен емкостью. Западная Европа находится в емкости и недоступна для новых экземпляров. Другие регионы имеют емкость для определенных уровней. Одним из преимуществ использования портал Azure для настройки ресурсов является то, что он предоставляет только те регионы и уровни, которые доступны. Вы не можете выбрать регионы или уровни, которые недоступны.

  • Вы хотите использовать интегрированные блоки данных и векторизацию или встроенные навыки для обогащения ИИ. Учетные записи нескольких служб ИИ Azure и Azure OpenAI должны находиться в том же регионе, что и поиск ИИ Azure для интеграции. Выберите регион , предоставляющий все необходимые ресурсы.

  • Вы хотите использовать служба хранилища Azure для индексирования на основе индексатора или хранить данные приложения, которые не хранятся в индексе. Состояние сеанса отладки, кэши обогащения и хранилища знаний — это функции поиска ИИ Azure, которые зависят от служба хранилища Azure. Регион, который вы выбираете для служба хранилища Azure, имеет последствия для безопасности сети. В частности, если вы настраиваете брандмауэр, следует разместить ресурсы в отдельных регионах. Дополнительные сведения см. в разделе "Исходящие подключения" из службы "Поиск ИИ Azure" для служба хранилища Azure.

Ниже приведен контрольный список для выбора региона:

  1. Доступен ли поиск по искусственному интеллекту Azure в соседнем регионе? Проверьте список поддерживаемых регионов. Регионы с ограничениями емкости указываются в сносках.

  2. Знаете ли вы, какой уровень вы хотите использовать? Уровни рассматриваются на следующем шаге. Проверьте доступность региона по уровням , чтобы определить, можно ли создать службу поиска на нужном уровне в выбранном регионе.

  3. Требуется ли обогащение и векторизация интегрированных данных ИИ? Убедитесь, что службы Azure OpenAI и Azure AI предлагаются в том же регионе , что и поиск в Azure AI.

    Помните, что API многомодальных внедрений azure AI Vision, используемый для интегрированной векторизации изображений, должен быть доступен через учетную запись многослужб Azure AI, но доступен в меньшем подмножестве регионов.

  4. У вас есть требования к непрерывности бизнес-процессов и аварийному восстановлению (BCDR)? Такие требования определяют создание нескольких служб поиска в региональных парах в зонах доступности. Например, если вы работаете в Северная Америка, для каждой службы поиска можно выбрать восточную часть США и западную часть США или центрально-северную часть США и южную часть США.

Выбор уровня

Поиск по искусственному интеллекту Azure предлагается в нескольких ценовых категориях: бесплатный, базовый, стандартный или оптимизированный для хранилища. Каждая категория отличается собственным объемом и ограничениями. Существует также несколько функций, зависящих от уровня.

Просмотрите описания уровня для вычислений характеристик и доступности компонентов.

Базовый и стандартный — это наиболее распространенный вариант для рабочих нагрузок, но многие клиенты начинаются с бесплатной службы. Среди оплачиваемых уровней основные различия включают размер секций и скорость, а также ограничения на количество создаваемых объектов.

Снимок экрана: страница

служба , созданные после 3 апреля 2024 г., имеют более крупные секции и более высокие квоты векторов.

В настоящее время некоторые регионы ограничены уровнями. Дополнительные сведения см. в разделе о доступности по регионам по уровням.

Помните, что ценовая категория не может быть изменена после создания службы. Если вам нужен более высокий или нижний уровень, необходимо повторно создать службу.

Создание службы

Когда вы предоставите необходимые входные данные, переходите к созданию службы.

Снимок экрана: просмотр и создание страницы службы.

Служба развертывается в течение нескольких минут. Ход выполнения можно отслеживать с помощью уведомлений Azure. Рассмотрите возможность закрепления службы на панели мониторинга для быстрого доступа в будущем.

Снимок экрана: монитор и закрепление страницы службы.

Настройка проверки подлинности

Если вы не используете портал, программный доступ к новой службе требует предоставления конечной точки URL-адреса и аутентифицированного подключения. Вы можете использовать любой из следующих вариантов:

  1. При настройке программного подключения требуется конечная точка службы поиска. Найдите и скопируйте конечную точку URL-адреса в правой части страницы Обзор.

    Снимок экрана: страница обзора службы с конечной точкой URL-адреса.

  2. Чтобы задать параметры проверки подлинности, используйте страницу "Ключи ". Большинство кратких руководств и руководств используют ключи API для простоты, но если вы настраиваете службу для рабочих нагрузок, рассмотрите возможность использования ролей Azure. С этой страницы можно скопировать ключи.

    Снимок экрана: страница

Для задач на основе портала не требуется конечная точка и ключ. Портал уже связан с ресурсом поиска ИИ Azure с правами администратора. Пошаговое руководство по порталу см. в кратком руководстве по созданию индекса поиска ИИ Azure на портале.

Выполните масштабирование службы

После подготовки службы поиска его можно масштабировать в соответствии с вашими потребностями. На оплачиваемом уровне можно масштабировать службу в двух измерениях: реплик и секций. Для бесплатной службы масштабирование недоступно, а конфигурация реплики и секционирования не предлагается.

Секции позволяют службе хранить данные и осуществлять поиск в большем количестве документов.

Реплики дают службе возможность справляться с повышенной нагрузкой запросов поиска.

Добавление ресурсов увеличивает ваш ежемесячный счет. Калькулятор цен поможет вам понять, как выставляются счета при добавлении ресурсов. Помните, что вы можете выбирать число ресурсов на основе нагрузки. Например, вы можете сначала увеличить число ресурсов для создания полного начального индекса, а затем уменьшить его до уровня, который больше подходит для добавочного индексирования.

  1. Перейдите к странице своей службы поиска на портале Azure.
  2. В области навигации слева щелкните Параметры>Масштаб.
  3. Используйте ползунок, чтобы добавить ресурсы любого типа.

Снимок экрана: страница масштабирования.

Когда следует добавлять вторую службу

Большинство клиентов используют только одну службу, подготовленную на уровне достаточной для ожидаемой загрузки. В одной службе может размещаться несколько индексов с учетом максимального ограничения выбранного уровня, при этом все индексы изолированы друг от друга. В поиске ИИ Azure запросы могут направляться только на один индекс, минимизируя вероятность случайного или преднамеренного получения данных из других индексов в той же службе.

Несмотря на то, что большинство пользователей использует только одну службу, избыточность служб может потребоваться, если в эксплуатационных целях необходимо обеспечить следующее:

Примечание.

В службе "Поиск по искусственному интеллекту Azure" нельзя разделить операции индексирования и запроса; Таким образом, вы никогда не создадите несколько служб для отдельных рабочих нагрузок. Индекс всегда запрашивается в службе, в которой он был создан (невозможно создать индекс в одной службе и скопировать его на другую).

Для обеспечения высокой доступности не требуется вторая служба. Высокий уровень доступности запросов достигается при использовании двух или более реплик в одной службе. Обновления реплики являются последовательными, что означает, что при развертывания обновления службы по крайней мере один из них работает. Дополнительные сведения об уровне обслуживания см. в разделе "Соглашения об уровне обслуживания".

Добавление дополнительных служб в подписку

Поиск ИИ Azure ограничивает количество служб поиска, которые можно изначально создать в подписке. Если максимальное ограничение исчерпано, можно запросить больше квоты.

Для запроса квоты на подписку необходимо иметь разрешения владельца или участника. В зависимости от емкости региона и центра обработки данных можно автоматически запрашивать дополнительные квоты для добавления служб в подписку. Если запрос завершается сбоем, следует уменьшить число или отправить запрос в службу поддержки. Для большого увеличения квоты, например более 30 дополнительных служб, следует ожидать обходного решения в течение одного месяца.

  1. Войдите в портал Azure, найдите "квоты" на панели мониторинга и выберите службу "Квоты".

    Снимок экрана: условие поиска квоты и служба квот в результатах.

  2. На странице обзора квоты выберите "Поиск".

    Снимок экрана: плитка поиска на странице обзора квоты.

  3. Задайте фильтры, чтобы можно было просмотреть существующую квоту для служб поиска в текущей подписке. Мы рекомендуем фильтровать по использованию.

  4. Найдите регион и уровень, которым требуется дополнительная квота, и щелкните значок "Изменить карандаш", чтобы начать запрос.

    Снимок экрана: страница

  5. В сведениях о квоте укажите расположение, уровень и новое ограничение для квоты подписки. Ни одно из значений не может быть пустым. Новое ограничение должно быть больше текущего предела и равно или меньше числа в столбце увеличения квоты автоматически утверждено. Например, для уровня "Базовый" в заданном регионе, если текущее ограничение равно 16, новое ограничение может быть от 17 до 80.

    Уровень Ограничение по умолчанию Увеличение квоты с автоматически утвержденным разрешением Объединенный итог
    Базовая 16 80 96
    S1 16 30 46
    S2 8 10 18
    S3, S3HD 6 10 16
    L1, L2 6 10 16
  6. Отправьте запрос.

  7. Отслеживайте уведомления в портал Azure для обновлений состояния в новом пределе. Большинство запросов утверждены в течение 24 часов.

Следующие шаги

После подготовки службы вы можете продолжить создание своего первого индекса на портале.

Хотите оптимизировать и сократить ваши расходы на облако?