Что такое Служба Azure OpenAI?
Служба Azure OpenAI предоставляет доступ к мощным языковым моделям OpenAI, включая o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo с Vision, GPT-4, GPT-3.5-Turbo и серии внедрения. Эти модели можно легко адаптировать к конкретной задаче, включая, но не ограничивается созданием контента, сводные данные, понимание изображений, семантический поиск и естественный язык для перевода кода. Пользователи могут получить доступ к службе через REST API, пакет SDK для Python или в Azure AI Studio.
Обзор возможностей
Функция | Azure OpenAI |
---|---|
Доступные модели | o1-preview и o1-mini - (ограниченный доступ — запрос доступа) GPT-4o & GPT-4o mini Серия GPT-4 (включая GPT-4 Turbo с Vision) Серия GPT-3.5-Turbo Серия внедрения Дополнительные сведения см. на странице Модели. |
Точная настройка | GPT-4o-mini (предварительная версия) GPT-4 (предварительная версия) GPT-3.5-Turbo (0613) babbage-002 davinci-002 . |
Цена, | Доступно здесь Дополнительные сведения о GPT-4 Turbo с Vision см . в специальных ценах. |
Поддержка виртуальной сети и поддержка приватного канала | Да. |
Управляемое удостоверение | Да, с помощью идентификатора Microsoft Entra |
Взаимодействие с пользовательским интерфейсом | портал Azure для управления учетными записями и ресурсами, Azure AI Studio для изучения моделей и точной настройки |
Доступность региональных моделей | Доступность модели |
Фильтрация содержимого | Запросы и завершения оцениваются на соответствие нашей политике содержимого с помощью автоматизированных систем. Содержимое с высоким уровнем серьезности будет отфильтровано. |
Ответственное применение ИИ
В корпорации Майкрософт мы стремимся к развитию ИИ на основе принципов, которые ставят на первое место человека. Созданные модели, такие как те, которые доступны в Azure OpenAI, имеют значительные потенциальные преимущества, но без тщательного проектирования и тщательного устранения рисков, такие модели могут создавать неправильное или даже вредное содержимое. Корпорация Майкрософт внесла значительные инвестиции в защиту от злоупотреблений и непреднамеренного ущерба, включая включение принципов корпорации Майкрософт для ответственного использования ИИ, принятие кодекса поведения для использования службы, создание фильтров содержимого для поддержки клиентов и предоставление ответственной информации ИИ и рекомендаций , которые клиенты должны учитывать при использовании Azure OpenAI.
Как получить доступ к Azure OpenAI?
Форма регистрации ограниченного доступа не требуется для доступа к большинству моделей Azure OpenAI. Дополнительные сведения см. на странице Ограниченного доступа Azure OpenAI.
Сравнение Azure OpenAI и OpenAI
Служба Azure OpenAI предоставляет клиентам расширенный язык ИИ с помощью OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper и текстовых моделей речи с обещанием Azure безопасности и предприятия. Azure OpenAI совместно разрабатывает API с OpenAI, обеспечивая совместимость и плавное переход с одного на другое.
С помощью Azure OpenAI клиенты получают возможности безопасности Microsoft Azure, выполняя те же модели, что и OpenAI. Azure OpenAI предлагает частные сети, региональную доступность и фильтрацию содержимого ИИ.
Основные понятия
Запросы и завершения
Конечная точка завершения является основным компонентом службы API. Этот API предоставляет доступ к интерфейсу ввода и вывода текста модели. Пользователям просто нужно предоставить входной запрос, содержащий текстовую команду на английском языке, и модель создаст завершение текста.
Ниже приведен пример простого запроса и завершения:
Запрос:
""" count to 5 in a for loop """
Завершение:
for i in range(1, 6): print(i)
Токены
Текстовые маркеры
Azure OpenAI обрабатывает текст, разбив его на маркеры. Маркеры могут представлять собой слова или просто группы символов. Например, слово "гамбургер" разбивается на маркеры "гам", "бур" и "гер", а короткое и распространенное слово, например, "груша" является одним маркером. Многие маркеры начинаются с пробела, например " привет" и " пока".
Общее количество маркеров, обработанных в отдельном запросе, зависит от длины входных, выходных данных и параметров запроса. Количество обрабатываемых маркеров также повлияет на задержку ответа и пропускную способность моделей.
Маркеры изображений
Возможности обработки изображений Azure OpenAI с помощью GPT-4o, GPT-4o mini и GPT-4 Turbo с моделями визуального зрения используют маркеризацию изображений для определения общего количества маркеров, потребляемых входными данными изображения. Количество используемых маркеров вычисляется на основе двух основных факторов: уровень детализации изображения (низкий или высокий) и измерения изображения. Вот как вычисляются затраты на токены:
- Режим низкого разрешения
- Низкая детализация позволяет API возвращать более быстрые ответы для сценариев, которые не требуют анализа высокого разрешения изображений. Маркеры, используемые для изображений с низкой детализацией, :
- GPT-4o и GPT-4 Turbo с Vision: плоская скорость 85 токенов на изображение независимо от размера.
- GPT-4o mini: плоская скорость 2833 токенов на изображение независимо от размера.
- Пример: изображение 4096 x 8192 (низкая детализация) — это фиксированный 85 маркеров, так как это низкий уровень детализации, а размер не влияет на стоимость в этом режиме.
- Низкая детализация позволяет API возвращать более быстрые ответы для сценариев, которые не требуют анализа высокого разрешения изображений. Маркеры, используемые для изображений с низкой детализацией, :
- Режим высокого разрешения
- Низкая детализация позволяет API анализировать изображения более подробно. Маркеры изображения вычисляются на основе измерений изображения. Вычисление включает в себя следующие действия.
- Изменение размера изображения: изображение изменяется, чтобы он соответствовал размеру в квадрате 2048 x 2048 пикселей. Если кратчайшее значение больше 768 пикселей, изображение будет изменено, чтобы самая кратчайшее значение составило 768 пикселей. Пропорции сохраняются во время изменения размера.
- Вычисление плитки: после изменения размера изображение делится на 512 x 512 пикселей. Все частичные плитки округляются до полной плитки. Количество плиток определяет общую стоимость токена.
- Вычисление токена:
- GPT-4o и GPT-4 Turbo с Vision: Каждая плитка 512 x 512 пикселей стоит 170 токенов. К общей сумме добавляются дополнительные 85 базовых токенов .
- GPT-4o mini: каждая плитка 512 x 512 пикселей стоит 5667 токенов. Дополнительные базовые токены 2833 добавляются в общую сумму.
- Пример: изображение 2048 x 4096 (высокая детализация):
- Изображение изначально изменяется до 1024 x 2048 пикселей, чтобы поместиться в квадрат 2048 x 2048 пикселей.
- Изображение дополнительно изменится на 768 x 1536 пикселей, чтобы гарантировать, что самая короткая сторона составляет не более 768 пикселей.
- Изображение делится на 2 x 3 плитки, каждая из которых составляет 512 x 512 пикселей.
- Окончательный расчет:
- Для GPT-4o и GPT-4 Turbo с Vision общая стоимость токена составляет 6 плиток x 170 маркеров на плитку + 85 базовых токенов = 1105 токенов.
- Для GPT-4o mini общая стоимость токена составляет 6 плиток x 5667 маркеров на плитку + 2833 базовые токены = 36835 токенов.
- Низкая детализация позволяет API анализировать изображения более подробно. Маркеры изображения вычисляются на основе измерений изображения. Вычисление включает в себя следующие действия.
Ресурсы
Azure OpenAI — это новое предложение продукта в Azure. Вы можете приступить к работе с Azure OpenAI так же, как и любой другой продукт Azure, в котором вы создаете ресурс или экземпляр службы в подписке Azure. Дополнительные сведения о проектировании управления ресурсами Azure см. в этой статье.
Развертывания
После создания ресурса Azure OpenAI необходимо развернуть модель, прежде чем приступить к вызовам API и созданию текста. Это действие можно выполнить с помощью API развертывания. Эти API позволяют указать модель, которую вы хотите использовать.
Техника подсказок
Модели GPT-3, GPT-3.5 и GPT-4 из OpenAI основаны на запросах. С моделями на основе подсказок пользователь взаимодействует, вводя текстовый запрос, на который модель отвечает путем подстановки текста. Подставляя текст таким образом, модель дополняет текст, который вводится пользователем.
Хотя эти модели очень мощные, их поведение также очень зависит от подсказок. Это делает проектирование запроса важным навыком для разработки.
Создание запроса может быть сложной задачей. На практике запрос действует для настройки весов модели для выполнения требуемой задачи, но это больше искусства, чем наука, часто требующая опыта и интуиции для создания успешного запроса.
Модели
Служба предоставляет пользователям доступ к нескольким различным моделям. Модели обладают разными возможностями и имеют различные расценки.
Модели DALL-E (некоторые в предварительной версии; см . модели) создают изображения из текстовых запросов, которые предоставляет пользователь.
Модели Whisper можно использовать для транскрибирования и перевода речи в текст.
Текст для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста в речь.
Дополнительные сведения о каждой модели см. на странице концепции моделей.
Следующие шаги
Ознакомьтесь с дополнительными сведениями о базовых моделях, лежащих в основе Azure OpenAI.