O que há de novo no Serviço OpenAI do Azure

Artigo
05/03/2024

Este artigo fornece um resumo das versões mais recentes e das principais atualizações de documentação para o Azure OpenAI.

maio de 2024

Disponibilidade geral do modelo GPT-4 Turbo (GA)

A última versão GA do GPT-4 Turbo é:

gpt-4Versão:turbo-2024-04-09

Este é o substituto para os seguintes modelos de pré-visualização:

gpt-4Versão:1106-Preview
gpt-4Versão:0125-Preview
gpt-4Versão:vision-preview

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

A versão OpenAI do mais recente 0409 modelo turbo suporta o modo JSON e a função chamando para todas as solicitações de inferência.
A versão mais recente turbo-2024-04-09 do Azure OpenAI atualmente não oferece suporte ao uso do modo JSON e da chamada de função ao fazer solicitações de inferência com entrada de imagem (visão). As solicitações de entrada baseadas em texto (solicitações sem image_url e imagens embutidas) suportam o modo JSON e a chamada de função.

Diferenças do gpt-4 vision-preview

A integração de aprimoramentos de Visão específicos da IA do Azure com GPT-4 Turbo com Visão não é suportada para gpt-4a Versão:turbo-2024-04-09. Isso inclui Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo e processamento aprimorado de seus dados com imagens.

Disponibilidade gerenciada provisionada GPT-4 Turbo

gpt-4Versão:turbo-2024-04-09 está disponível para implantações padrão e provisionadas. Atualmente, a versão provisionada deste modelo não suporta solicitações de inferência de imagem/visão. As implantações provisionadas desse modelo só aceitam entrada de texto. As implantações de modelo padrão aceitam solicitações de inferência de texto e imagem/visão.

Disponibilidade da região

Para obter informações sobre a disponibilidade regional do modelo, consulte a matriz do modelo para implantações padrão e provisionadas.

Implantando o GPT-4 Turbo com o Vision GA

Para implantar o modelo GA a partir da interface do usuário do Studio, selecione GPT-4 e escolha a turbo-2024-04-09 versão no menu suspenso. A cota padrão para o gpt-4-turbo-2024-04-09 modelo será a mesma cota atual para GPT-4-Turbo. Consulte os limites das quotas regionais.

Abril de 2024

O ajuste fino agora é suportado em duas novas regiões Leste dos EUA 2 e Suíça Oeste

O ajuste fino está agora disponível com suporte para:

E.U.A. Leste 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Oeste da Suíça

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo e o suporte ao ajuste fino em cada região.

Exemplos de treinamento de bate-papo em vários turnos

O ajuste fino agora suporta exemplos de treinamento de bate-papo em vários turnos.

O GPT-4 (0125) está disponível para o Azure OpenAI On Your Data

Agora você pode usar o modelo GPT-4 (0125) em regiões disponíveis com o Azure OpenAI On Your Data.

Março de 2024

Riscos e monitoramento de segurança no Azure OpenAI Studio

O Azure OpenAI Studio agora fornece um painel de Riscos e Segurança para cada uma de suas implantações que usa uma configuração de filtro de conteúdo. Use-o para verificar os resultados da atividade de filtragem. Em seguida, você pode ajustar sua configuração de filtro para atender melhor às suas necessidades de negócios e atender aos princípios de IA responsável.

Utilização de Riscos e Monitorização de Segurança

Azure OpenAI em suas atualizações de dados

Agora você pode se conectar a um banco de dados vetorial do Elasticsearch para ser usado com o Azure OpenAI On Your Data.
Você pode usar o parâmetro chunk size durante a ingestão de dados para definir o número máximo de tokens de qualquer bloco de dados em seu índice.

2024-02-01 Lançada a API de disponibilidade geral (GA)

Esta é a versão mais recente da API do GA e é a substituição da versão anterior 2023-05-15 do GA. Esta versão adiciona suporte para os recursos mais recentes do Azure OpenAI GA, como Whisper, DALLE-3, ajuste fino, em seus dados, etc.

Recursos que ainda estão em visualização, como Assistentes, texto para fala (TTS), determinados em suas fontes de dados de dados, ainda exigem uma versão de API de visualização. Para obter mais informações, consulte nosso guia de ciclo de vida da versão da API.

Sussurrar disponibilidade geral (GA)

O modelo Whisper speech to text agora é GA para REST e Python. Os SDKs da biblioteca de cliente ainda estão em visualização pública.

Experimente o Whisper seguindo um início rápido.

Disponibilidade geral do DALL-E 3 (GA)

O modelo de geração de imagens DALL-E 3 agora é GA para REST e Python. Os SDKs da biblioteca de cliente ainda estão em visualização pública.

Experimente o DALL-E 3 seguindo um início rápido.

Novo suporte regional para DALL-E 3

Agora você pode acessar o DALL-E 3 com um recurso do Azure OpenAI na região ou AustraliaEast no East US Azure, além do SwedenCentral.

Descontinuações e aposentadorias de modelos

Adicionámos uma página para controlar as descontinuações e desativações de modelos no Serviço OpenAI do Azure. Esta página fornece informações sobre os modelos atualmente disponíveis, preteridos e desativados.

2024-03-01-preview API lançada

2024-03-01-preview tem a mesma funcionalidade 2024-02-15-preview e adiciona dois novos parâmetros para incorporações:

encoding_format Permite especificar o formato para gerar incorporações em float, ou base64. A predefinição é float.
dimensions Permite definir o número de incorporações de saída. Este parâmetro só é suportado com os novos modelos de incorporação de terceira geração: text-embedding-3-large, text-embedding-3-small. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

Se você estiver usando uma versão de visualização da API para aproveitar os recursos mais recentes, recomendamos consultar o artigo do ciclo de vida da versão da API para controlar por quanto tempo sua versão atual da API será suportada.

Atualização para os planos de atualização GPT-4-1106-Preview

A atualização de implantação do 1106-Preview para gpt-4 o 0125-Preview agendada para 8 de março de gpt-4 2024 não está mais ocorrendo. As implantações das gpt-4 versões 1106-Preview e 0125-Preview definidas como "Auto-update to default" e "Upgrade when expired" começarão a ser atualizadas após o lançamento de uma versão estável do modelo.

Para obter mais informações sobre o processo de atualização, consulte a página de modelos.

Fevereiro de 2024

Modelo GPT-3.5-turbo-0125 disponível

Este modelo tem várias melhorias, incluindo maior precisão na resposta nos formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Modelos de incorporação de terceira geração disponíveis

text-embedding-3-large
text-embedding-3-small

Em testes, a OpenAI relata que os modelos de incorporação de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL , mantendo ainda um melhor desempenho para tarefas em inglês com o benchmark MTEB do que o modelo text-embedding-ada-002 de segunda geração.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Consolidação de cotas GPT-3.5 Turbo

Para simplificar a migração entre diferentes versões dos modelos GPT-3.5-Turbo (incluindo 16k), vamos consolidar todas as quotas GPT-3.5-Turbo num único valor de quota.

Todos os clientes que tiverem aumentado a quota aprovada terão quota total combinada que reflete os aumentos anteriores.
Qualquer cliente cujo uso total atual nas versões do modelo seja menor do que o padrão receberá uma nova cota total combinada por padrão.

GPT-4-0125-preview modelo disponível

A gpt-4 versão 0125-preview do modelo agora está disponível no Serviço OpenAI do Azure nas regiões Leste dos EUA, Centro-Norte dos EUA e Centro-Sul dos EUA. Os clientes com implantações de gpt-4 versão 1106-preview serão atualizados automaticamente nas 0125-preview próximas semanas.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Pré-visualização pública da API de assistentes

O Azure OpenAI agora suporta a API que alimenta os GPTs do OpenAI. Os Assistentes OpenAI do Azure (Pré-visualização) permitem-lhe criar assistentes de IA adaptados às suas necessidades através de instruções personalizadas e ferramentas avançadas, como interpretador de código e funções personalizadas. Para saber mais, veja:

Visualização pública de vozes de texto para fala OpenAI

O Serviço OpenAI do Azure agora oferece suporte a APIs de texto para fala com as vozes do OpenAI. Obtenha fala gerada por IA a partir do texto fornecido. Para saber mais, consulte o guia de visão geral e experimente o início rápido.

Nota

O Azure AI Speech também dá suporte a vozes de texto para fala do OpenAI. Para saber mais, consulte Texto do OpenAI para vozes de fala por meio do Serviço OpenAI do Azure ou do Guia de Fala do Azure AI.

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o Azure OpenAI On Your Data

Agora você pode usar o Azure OpenAI On Your Data na seguinte região do Azure:

Norte da África do Sul

Disponibilidade geral do Azure OpenAI On Your Data

O Azure OpenAI On Your Data agora está disponível para o público em geral.

Dezembro de 2023

Azure OpenAI em seus dados

Suporte completo de VPN e ponto final privado para o Azure OpenAI On Your Data, incluindo suporte de segurança para: contas de armazenamento, recursos do Azure OpenAI e recursos do serviço Azure AI Search.
Novo artigo para usar o Azure OpenAI On Your Data com segurança , protegendo dados com redes virtuais e pontos de extremidade privados.

GPT-4 Turbo com Visão já está disponível

O serviço GPT-4 Turbo com Visão no Azure OpenAI está agora em pré-visualização pública. GPT-4 Turbo with Vision é um grande modelo multimodal (LMM) desenvolvido pela OpenAI que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Incorpora processamento de linguagem natural e compreensão visual. Com o modo avançado, você pode usar os recursos do Azure AI Vision para gerar informações adicionais a partir das imagens.

Explore os recursos do GPT-4 Turbo com Visão em uma experiência sem código usando o Azure OpenAI Playground. Saiba mais no Guia de início rápido.
O aprimoramento da visão usando o GPT-4 Turbo com Visão agora está disponível no Azure OpenAI Playground e inclui suporte para Reconhecimento Ótico de Caracteres, aterramento de objetos, suporte de imagem para "adicionar seus dados" e suporte para prompt de vídeo.
Faça chamadas para a API de chat diretamente usando a API REST.
A disponibilidade da região está atualmente limitada a SwitzerlandNorth, SwedenCentral, WestUSe AustraliaEast
Saiba mais sobre as limitações conhecidas do GPT-4 Turbo com Visão e outras perguntas frequentes.

Novembro de 2023

Novo suporte de fonte de dados no Azure OpenAI On Your Data

Agora você pode usar o Azure Cosmos DB para MongoDB vCore , bem como URLs/endereços da Web como fontes de dados para ingerir seus dados e conversar com um modelo OpenAI do Azure com suporte.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 lançado

Ambos os modelos são a versão mais recente do OpenAI com instruções aprimoradas, modo JSON, saída reproduzível e chamada de função paralela.

O GPT-4 Turbo Preview tem uma janela de contexto máxima de 128.000 tokens e pode gerar 4.096 tokens de saída. Tem os mais recentes dados de formação com conhecimento até abril de 2023. Este modelo está em pré-visualização e não é recomendado para uso em produção. Todas as implantações deste modelo de visualização serão atualizadas automaticamente assim que a versão estável estiver disponível.
O GPT-3.5-Turbo-1106 tem uma janela de contexto máxima de 16.385 tokens e pode gerar 4.096 tokens de saída.

Para obter informações sobre a disponibilidade regional do modelo, consulte a página de modelos.

Os modelos têm suas próprias alocações de cotas exclusivas por região.

Pré-visualização pública do DALL-E 3

DALL-E 3 é o modelo de última geração de imagens da OpenAI. Ele apresenta qualidade de imagem aprimorada, cenas mais complexas e melhor desempenho ao renderizar texto em imagens. Ele também vem com mais opções de proporção. DALL-E 3 está disponível através do OpenAI Studio e através da API REST. Seu recurso OpenAI deve estar na SwedenCentral região do Azure.

O DALL-E 3 inclui reescrita de prompt integrada para melhorar as imagens, reduzir a distorção e aumentar a variação natural.

Experimente o DALL-E 3 seguindo um início rápido.

IA responsável

Configurabilidade expandida do cliente: todos os clientes do Azure OpenAI agora podem configurar todos os níveis de gravidade (baixo, médio, alto) para as categorias ódio, violência, sexual e automutilação, incluindo a filtragem apenas de conteúdo de alta gravidade. Configurar filtros de conteúdo
Credenciais de conteúdo em todos os modelos DALL-E: as imagens geradas por IA de todos os modelos DALL-E agora incluem uma credencial digital que divulga o conteúdo como gerado por IA. Os aplicativos que exibem ativos de imagem podem aproveitar o SDK da Content Authenticity Initiative de código aberto para exibir credenciais em suas imagens geradas por IA. Credenciais de conteúdo no Azure OpenAI
Novos modelos RAI
- Deteção de risco de jailbreak: Os ataques de jailbreak são prompts do usuário projetados para provocar o modelo de IA generativa a exibir comportamentos que ele foi treinado para evitar ou quebrar as regras definidas na mensagem do sistema. O modelo de deteção de risco de jailbreak é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em prompts do usuário.
- Texto de material protegido: o texto de material protegido descreve o conteúdo de texto conhecido (por exemplo, letras de músicas, artigos, receitas e conteúdo da Web selecionado) que pode ser gerado por modelos de linguagem grandes. O modelo de texto de material protegido é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em finalizações LLM.
- Código de material protegido: O código de material protegido descreve o código-fonte que corresponde a um conjunto de código-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem a citação adequada de repositórios de código-fonte. O modelo de código de material protegido é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em finalizações LLM.
Configurar filtros de conteúdo
Listas de bloqueio: os clientes agora podem personalizar rapidamente o comportamento do filtro de conteúdo para prompts e completações, criando uma lista de bloqueio personalizada em seus filtros. A lista de bloqueio personalizada permite que o filtro execute ações em uma lista personalizada de padrões, como termos específicos ou padrões regex. Além de listas de bloqueio personalizadas, fornecemos uma lista de bloqueio de palavrões da Microsoft (inglês). Usar listas de bloqueio

Outubro de 2023

Novos modelos de ajuste fino (pré-visualização)

gpt-35-turbo-0613 está agora disponível para afinação.
babbage-002 e davinci-002 estão agora disponíveis para afinação. Esses modelos substituem os modelos básicos antigos ada, babbage, curie e davinci que estavam anteriormente disponíveis para ajuste fino.
A disponibilidade de ajuste fino é limitada a determinadas regiões. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.
Os modelos ajustados têm limites de quota diferentes dos modelos normais.
Tutorial: ajuste fino GPT-3.5-Turbo

Azure OpenAI em seus dados

Novos parâmetros personalizados para determinar o número de documentos recuperados e rigor.
- A definição de rigor define o limite para categorizar documentos como relevantes para as suas consultas.
- A configuração de documentos recuperados especifica o número de documentos com melhor pontuação do índice de dados usado para gerar respostas.
Você pode ver o status de ingestão/carregamento de dados no Azure OpenAI Studio.
Suporte para endpoints privados & VPNs para contêineres de blob.

Setembro de 2023

GPT-4

O GPT-4 e o GPT-4-32k estão agora disponíveis para todos os clientes do Serviço OpenAI do Azure. Os clientes não precisam mais solicitar a lista de espera para usar GPT-4 e GPT-4-32k (os requisitos de registro de Acesso Limitado continuam a ser aplicados a todos os modelos do Azure OpenAI). A disponibilidade pode variar de acordo com a região. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

GPT-3.5 Turbo Instrução

O Serviço Azure OpenAI agora suporta o modelo GPT-3.5 Turbo Instruct. Este modelo tem desempenho comparável e text-davinci-003 está disponível para uso com a API de conclusão. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Pré-visualização pública do sussurro

O Serviço OpenAI do Azure agora oferece suporte a APIs de fala para texto com tecnologia do modelo Whisper da OpenAI. Obtenha texto gerado por IA com base no áudio de fala fornecido. Para saber mais, confira o guia de início rápido.

Nota

O Azure AI Speech também suporta o modelo Whisper da OpenAI através da API de transcrição em lote. Para saber mais, consulte o guia Criar uma transcrição em lote. Confira O que é o modelo Whisper?, para saber mais sobre quando usar o Azure AI Speech versus o Azure OpenAI Service.

Novas Regiões

O Azure OpenAI agora também está disponível nas regiões Suécia Central e Suíça Norte. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Aumento dos limites regionais das quotas

Aumenta para os limites máximos de cota padrão para determinados modelos e regiões. A migração de cargas de trabalho para esses modelos e regiões permitirá que você aproveite os Tokens por minuto (TPM) mais altos.

Agosto de 2023

Azure OpenAI em suas próprias atualizações de dados (visualização)

Agora você pode implantar o Azure OpenAI em seus dados para Power Virtual Agents.
O Azure OpenAI On Your Data agora oferece suporte a pontos de extremidade privados.
Capacidade de filtrar o acesso a documentos confidenciais.
Atualize automaticamente seu índice de acordo com uma programação.
Pesquisa vetorial e opções de pesquisa semântica.
Exibir seu histórico de bate-papo no aplicativo Web implantado

Julho de 2023

Suporte para chamada de função

O Azure OpenAI agora dá suporte à chamada de função para permitir que você trabalhe com funções na API de conclusão de chat.

Incorporação de aumento de matriz de entrada

O Azure OpenAI agora oferece suporte a matrizes com até 16 entradas por solicitação de API com text-embedding-ada-002 Versão 2.

Novas Regiões

O Azure OpenAI agora também está disponível nas regiões Leste do Canadá, Leste dos EUA 2, Leste do Japão e Centro-Norte dos EUA. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Junho de 2023

Usar o Azure OpenAI em seus próprios dados (visualização)

O Azure OpenAI On Your Data está agora disponível em pré-visualização, permitindo-lhe conversar com modelos OpenAI como GPT-35-Turbo e GPT-4 e receber respostas com base nos seus dados.

Novas versões dos modelos gpt-35-turbo e gpt-4

GPT-35-Turbo (Versão 0613)
GPT-35-Turbo-16K (Versão 0613)
GPT-4 (Versão 0613)
GPT-4-32K (Versão 0613)

Sul do Reino Unido

Azure OpenAI agora está disponível na região Sul do Reino Unido. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Filtragem de conteúdo e anotações (Pré-visualização)

Como configurar filtros de conteúdo com o Serviço Azure OpenAI.
Habilite as anotações para exibir informações de gravidade e categoria de filtragem de conteúdo como parte de suas chamadas de Conclusão de Chat e Conclusão de Chat baseadas em GPT.

Quota

A cota oferece a flexibilidade de gerenciar ativamente a alocação de limites de taxa nas implantações em sua assinatura.

Maio de 2023

Suporte a Java & JavaScript SDK

NOVOS SDKs de visualização do Azure OpenAI que oferecem suporte para JavaScript e Java.

Disponibilidade Geral (GA) de Conclusão do Chat OpenAI do Azure

Suporte de disponibilidade geral para:
- Versão da API 2023-05-15de conclusão do bate-papo .
- Modelos GPT-35-Turbo.
- Série de modelos GPT-4.

Se você estiver usando a 2023-03-15-preview API no momento, recomendamos migrar para a API do GA 2023-05-15 . Se você estiver usando a versão 2022-12-01 da API, essa API permanecerá GA, mas não incluirá os recursos mais recentes de conclusão de bate-papo.

Importante

O uso das versões atuais dos modelos GPT-35-Turbo com o ponto final de conclusão permanece em visualização.

França Central

Azure OpenAI agora está disponível na região França Central. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Abril de 2023

Visualização pública do DALL-E 2. O Serviço Azure OpenAI agora suporta APIs de geração de imagem alimentadas pelo modelo DALL-E 2 da OpenAI. Obtenha imagens geradas por IA com base no texto descritivo fornecido. Para saber mais, confira o guia de início rápido. Para solicitar acesso, os clientes existentes do Azure OpenAI podem se inscrever preenchendo este formulário.
Implantações inativas de modelos personalizados agora serão excluídas após 15 dias; os modelos permanecerão disponíveis para reimplantação. Se um modelo personalizado (ajustado) for implantado por mais de quinze (15) dias durante os quais nenhuma conclusão ou chamada de conclusão de bate-papo for feita para ele, a implantação será excluída automaticamente (e nenhuma cobrança adicional de hospedagem será incorrida para essa implantação). O modelo personalizado subjacente permanecerá disponível e pode ser reimplantado a qualquer momento. Para saber mais, consulte o artigo de instruções.

Março de 2023

Os modelos da série GPT-4 estão agora disponíveis em pré-visualização no Azure OpenAI. Para solicitar acesso, os clientes existentes do Azure OpenAI podem se inscrever preenchendo este formulário. Estes modelos estão atualmente disponíveis nas regiões Leste dos EUA e Centro-Sul dos EUA.
Nova API de conclusão de bate-papo para modelos GPT-35-Turbo e GPT-4 lançada em pré-visualização em 21/03. Para saber mais, confira os guias de início rápido e o artigo de instruções atualizados.
Visualização GPT-35-Turbo. Para saber mais, confira o artigo de instruções.
Limites de treinamento aumentados para ajuste fino: O tamanho máximo do trabalho de treinamento (tokens no arquivo de treinamento) x (# de épocas) é de 2 bilhões de tokens para todos os modelos. Também aumentamos o trabalho máximo de treinamento de 120 para 720 horas.
Adicionar casos de uso adicionais ao seu acesso existente. Anteriormente, o processo de adição de novos casos de uso exigia que os clientes se recandidatassem ao serviço. Agora, estamos lançando um novo processo que permite que você adicione rapidamente novos casos de uso ao seu uso do serviço. Este processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure. Os clientes existentes podem atestar todos e quaisquer novos casos de uso aqui. Por favor, note que isso é necessário sempre que você gostaria de usar o serviço para um novo caso de uso que você não solicitou originalmente.

Fevereiro de 2023

Novos recursos

Exemplos de versão | de visualização do SDK do .NET (inferência)
Atualização do SDK do Terraform para dar suporte às operações de gerenciamento do Azure OpenAI.
A inserção de texto no final de uma conclusão agora é suportada com o suffix parâmetro.

Atualizações

A filtragem de conteúdo está ativada por padrão.

Novos artigos sobre:

Novo curso de formação:

Introdução ao Azure OpenAI

Janeiro de 2023

Novos recursos

Serviço GA. O Serviço Azure OpenAI agora está disponível para o público em geral.
Novos modelos: Adição do modelo de texto mais recente, text-davinci-003 (Leste dos EUA, Europa Ocidental), text-ada-embeddings-002 (Leste dos EUA, Centro-Sul dos EUA, Europa Ocidental)

Dezembro de 2022

Novas funcionalidades

Os modelos mais recentes da OpenAI. O Azure OpenAI fornece acesso a todos os modelos mais recentes, incluindo a série GPT-3.5.
Nova versão da API (2022-12-01). Esta atualização inclui vários aprimoramentos solicitados, incluindo informações de uso de token na resposta da API, mensagens de erro aprimoradas para arquivos, alinhamento com o OpenAI no ajuste fino da estrutura de dados de criação e suporte para o parâmetro de sufixo para permitir a nomeação personalizada de trabalhos ajustados.
Limites mais elevados de pedidos por segundo. 50 para modelos não Davinci. 20 para os modelos Davinci.
Implantações de ajuste fino mais rápidas. Implante modelos Ada e Curie ajustados em menos de 10 minutos.
Limites de treinamento mais altos: 40 milhões de tokens de treinamento para Ada, Babbage e Curie. 10M para Davinci.
Processo para solicitar modificações no abuso e registro de dados de uso incorreto ou revisão humana. Hoje, o serviço registra dados de solicitação/resposta para fins de deteção de abuso e uso indevido para garantir que esses modelos poderosos não sejam abusados. No entanto, muitos clientes têm requisitos rigorosos de privacidade e segurança de dados que exigem maior controle sobre seus dados. Para dar suporte a esses casos de uso, estamos lançando um novo processo para que os clientes modifiquem as políticas de filtragem de conteúdo ou desativem o log de abuso para casos de uso de baixo risco. Este processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure e os clientes OpenAI existentes podem candidatar-se aqui.
Criptografia de chave gerenciada pelo cliente (CMK). A CMK fornece aos clientes maior controle sobre o gerenciamento de seus dados no Azure OpenAI, fornecendo suas próprias chaves de criptografia usadas para armazenar dados de treinamento e modelos personalizados. As chaves geridas pelo cliente (CMK), também conhecidas como bring your own key (BYOK), oferecem maior flexibilidade para criar, rodar, desativar e revogar os controlos de acesso. Também pode auditar as chaves de encriptação utilizadas para proteger os dados. Saiba mais com a nossa documentação de encriptação em repouso.
Suporte a Lockbox
Conformidade com SOC-2
Registo e diagnóstico através das definições de Estado de Funcionamento dos Recursos do Azure, Análise de Custos e Métricas e Diagnóstico.
Melhorias no estúdio. Várias melhorias de usabilidade no fluxo de trabalho do Studio, incluindo suporte à função do Azure AD para controlar quem na equipe tem acesso para criar modelos ajustados e implantar.

Alterações (quebra)

O ajuste fino da solicitação de criação de API foi atualizado para corresponder ao esquema da OpenAI.

Pré-visualizar versões da API:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API versão 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

A filtragem de conteúdo está temporariamente desativada por padrão. A moderação de conteúdo do Azure funciona de forma diferente do Azure OpenAI. O Azure OpenAI executa filtros de conteúdo durante a chamada de geração para detetar conteúdo prejudicial ou abusivo e filtra-os da resposta. Saiba mais

Esses modelos serão reativados no 1º trimestre de 2023 e estarão ativados por padrão.

Ações do cliente

Entre em contato com o Suporte do Azure se quiser que eles sejam ativados para sua assinatura.
Solicite modificações de filtragem, se quiser que elas permaneçam desativadas. (Esta opção será apenas para casos de uso de baixo risco.)

Próximos passos

Saiba mais sobre os modelos subjacentes que alimentam o Azure OpenAI.

O que há de novo no Serviço OpenAI do Azure

maio de 2024

Disponibilidade geral do modelo GPT-4 Turbo (GA)

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

Diferenças do gpt-4 vision-preview

Disponibilidade gerenciada provisionada GPT-4 Turbo

Disponibilidade da região

Implantando o GPT-4 Turbo com o Vision GA

Abril de 2024

O ajuste fino agora é suportado em duas novas regiões Leste dos EUA 2 e Suíça Oeste

E.U.A. Leste 2

Oeste da Suíça

Exemplos de treinamento de bate-papo em vários turnos

O GPT-4 (0125) está disponível para o Azure OpenAI On Your Data

Março de 2024

Riscos e monitoramento de segurança no Azure OpenAI Studio

Azure OpenAI em suas atualizações de dados

2024-02-01 Lançada a API de disponibilidade geral (GA)

Sussurrar disponibilidade geral (GA)

Disponibilidade geral do DALL-E 3 (GA)

Novo suporte regional para DALL-E 3

Descontinuações e aposentadorias de modelos

2024-03-01-preview API lançada

Atualização para os planos de atualização GPT-4-1106-Preview

Fevereiro de 2024

Modelo GPT-3.5-turbo-0125 disponível

Modelos de incorporação de terceira geração disponíveis

Consolidação de cotas GPT-3.5 Turbo

GPT-4-0125-preview modelo disponível

Pré-visualização pública da API de assistentes

Visualização pública de vozes de texto para fala OpenAI

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o Azure OpenAI On Your Data

Disponibilidade geral do Azure OpenAI On Your Data

Dezembro de 2023

Azure OpenAI em seus dados

GPT-4 Turbo com Visão já está disponível

Novembro de 2023

Novo suporte de fonte de dados no Azure OpenAI On Your Data

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 lançado

Pré-visualização pública do DALL-E 3

IA responsável

Outubro de 2023

Novos modelos de ajuste fino (pré-visualização)

Azure OpenAI em seus dados

Setembro de 2023

GPT-4

GPT-3.5 Turbo Instrução

Pré-visualização pública do sussurro

Novas Regiões

Aumento dos limites regionais das quotas

Agosto de 2023

Azure OpenAI em suas próprias atualizações de dados (visualização)

Julho de 2023

Suporte para chamada de função

Incorporação de aumento de matriz de entrada

Novas Regiões

Junho de 2023

Usar o Azure OpenAI em seus próprios dados (visualização)

Novas versões dos modelos gpt-35-turbo e gpt-4

Sul do Reino Unido

Filtragem de conteúdo e anotações (Pré-visualização)

Quota

Maio de 2023

Suporte a Java & JavaScript SDK

Disponibilidade Geral (GA) de Conclusão do Chat OpenAI do Azure

França Central

Abril de 2023

Março de 2023

Fevereiro de 2023

Novos recursos

Atualizações

Janeiro de 2023

Novos recursos

Dezembro de 2022

Novas funcionalidades

Alterações (quebra)

Próximos passos

Recursos adicionais