Novidades do Serviço OpenAI do Azure

Abril de 2024

O ajuste fino agora tem suporte em duas novas regiões: Leste dos EUA 2 e Oeste da Suíça

O ajuste fino agora está disponível com suporte para:

Leste dos EUA 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Oeste da Suíça

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos e o suporte para ajuste fino em cada região.

Exemplos de treinamento de chat de vários turnos

O ajuste fino agora dá suporte a exemplos de treinamento de chat de vários turnos.

O GPT-4 (0125) está disponível para o OpenAI do Azure em seus Dados

Agora você já pode usar o modelo GPT-4 (0125) nas regiões disponíveis com o OpenAI do Azure em seus Dados.

Março de 2024

Monitoramento de riscos e de segurança no estúdio do OpenAI do Azure

O estúdio do OpenAI do Azure agora fornece um painel de riscos e de segurança para cada uma das implantações que utiliza uma configuração de filtro de conteúdo. Utilize-o para verificar os resultados da atividade de filtragem. Em seguida, você poderá ajustar a configuração de filtro para atender melhor às suas necessidades de negócios e atender aos princípios de IA Responsável.

Usar monitoramento de riscos e de segurança

Atualizações do Azure OpenAI On Your Data

  • Agora, você poderá conectar um banco de dados vetorial Elasticsearch para utilizar com o Azure OpenAI On Your Data.
  • Você pode usar o parâmetro de tamanho da parte durante a ingestão de dados para definir o número máximo de tokens de qualquer parte dos dados fornecidos em seu índice.

GA (disponibilidade geral) da API lançada em 01/02/2024

Esta é a versão mais recente da API GA e é a substituição da versão GA anterior 2023-05-15. Essa versão adiciona suporte para os recursos em GA do OpenAI do Azure mais recentes, como Whisper, DALL-E 3, ajuste fino, On Your Data, etc.

Recursos que ainda estão em versão prévia, como Assistentes, TTS (conversão de texto em fala), determinados em suas fontes de dados, ainda exigem uma versão prévia da API. Para obter mais informações, confira nosso guia de ciclo de vida da versão da API.

Disponibilidade geral do Whisper (GA)

O modelo de conversão de fala em texto do Whisper agora está em GA para REST e Python. Os SDKs da biblioteca de clientes ainda estão em versão prévia pública.

Experimente Whisper seguindo um início rápido.

disponibilidade geral (GA) do DALL-E 3

O modelo de geração de imagem DALL-E 3 agora está em GA para REST e Python. Os SDKs da biblioteca de clientes ainda estão em versão prévia pública.

Experimente o DALL-E 3 seguindo o início rápido.

Novo suporte regional para DALL-E 3

Agora você pode acessar o DALL-E 3 com um recurso do OpenAI do Azure na região do Azure East US no AustraliaEast, além de SwedenCentral.

Substituições e desativações do modelo

Adicionamos uma página para acompanhar as substituições e desativações de modelo no Serviço OpenAI do Azure. Esta página fornece informações sobre os modelos que estão disponíveis, preteridos e desativados no momento.

API 2024-03-01-preview lançada

2024-03-01-preview tem todas as mesmas funcionalidades que 2024-02-15-preview e adiciona dois novos parâmetros para inserções:

  • encoding_format permite especificar o formato para gerar inserções em floatou base64. O padrão é float.
  • dimensions permite definir o número de inserções de saída. Esse parâmetro só tem suporte com os novos modelos de incorporação de terceira geração: text-embedding-3-large, text-embedding-3-small. Normalmente, inserções maiores são mais caras de uma perspectiva de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo e o desempenho gerais. Não há suporte para o parâmetro dimensions em todas as versões da biblioteca OpenAI 1.x Python. Para aproveitar esse parâmetro, recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

Se você estiver usando uma versão prévia da API para aproveitar os recursos mais recentes, recomendamos consultar o artigo ciclo de vida da versão da API para acompanhar por quanto tempo a versão atual da API terá suporte.

Atualizar para planos de atualização GPT-4-1106-Preview

A atualização de implantação de gpt-4 1106-Preview para gpt-4 0125-Preview agendada para 8 de março de 2024 não está mais ocorrendo. As implantações das versões gpt-4 1106-Preview e 0125-Preview definidas como "Atualização automática para padrão" e "Atualizar quando expirado" começarão a ser atualizadas após o lançamento da versão estável.

Para obter mais informações sobre o processo de atualização, consulte a página modelos.

Fevereiro de 2024

Disponibilidade do modelo GPT-3.5-turbo-0125

O modelo tem vários aprimoramentos, incluindo maior precisão na resposta em formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função que não são em inglês.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Modelos de incorporações de terceira geração disponíveis

  • text-embedding-3-large
  • text-embedding-3-small

Em testes, o OpenAI relata que os modelos de inserções de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação de vários idiomas com o parâmetro de comparação MIRACL, mantendo ainda o desempenho para tarefas em inglês com o parâmetro de comparação MTEBdo que o modelo de segunda geração text-embedding-ada-002.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Consolidação da cota do GPT-3.5 Turbo

Para simplificar a migração entre diferentes versões dos modelos GPT-3.5-Turbo (incluindo 16k), consolidaremos toda a cota GPT-3.5-Turbo em um único valor de cota.

  • Todos os clientes que tiverem aumentado a cota aprovada terão cota total combinada que reflete os aumentos anteriores.

  • Qualquer cliente cujo uso total atual entre versões de modelo é menor que o padrão obterá uma nova cota total combinada por padrão.

Modelo de GPT-4-0125 versão prévia disponível

A versão gpt-4 do modelo 0125-preview agora está disponível no Serviço OpenAI do Azure nas regiões Leste dos EUA, Centro-Norte dos EUA e Centro-Sul dos EUA. Os clientes com implantações de gpt-4 versão 1106-preview serão atualizados automaticamente para0125-preview nas próximas semanas.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Visualização pública da API de Assistentes

A OpenAI do Azure agora dá suporte à API que alimenta os GPTs do OpenAI. Os Assistentes OpenAI do Azure (versão prévia) permitem que você crie assistentes de IA adaptados às suas necessidades por meio de instruções personalizadas e ferramentas avançadas, como o interpretador de códigos e funções personalizadas. Para obter mais informações, consulte:

Versão prévia das vozes da conversão de texto em fala do OpenAI

O Serviço OpenAI do Azure agora dá suporte a APIs de conversão de texto em fala com as vozes do OpenAI. Obtenha a fala gerada por IA do texto que você fornece. Para saber mais, consulte o guia de visão geral e experimente o início rápido.

Observação

A Fala de IA do Azure também dá suporte às vozes da conversão de texto em fala do OpenAI. Para saber mais, consulte o guia Vozes da conversão de texto em fala do OpenAI por meio do Serviço OpenAI do Azure ou Fala de IA do Azure.

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o OpenAI do Azure em seus dados

Agora você pode usar o Azure OpenAI On Your Data na seguinte região do Azure:

  • Norte da África do Sul

Disponibilidade geral do Azure OpenAI On Your Data

Dezembro de 2023

Azure OpenAI On Your Data

  • Suporte completo de VPN e ponto de extremidade privado para o Azure OpenAI On Your Data, incluindo suporte de segurança para: contas de armazenamento, recursos do OpenAI do Azure e recursos de serviço da Pesquisa de IA do Azure.
  • Novo artigo para usar Azure OpenAI On Your Data com segurança protegendo dados com redes virtuais e pontos de extremidade privados.

GPT-4 Turbo com Visão agora disponível

O GPT-4 Turbo com Visão no serviço Azure OpenAI agora está em versão prévia pública. O GPT-4 Turbo with Vision é um grande modelo multimodal (LMM) desenvolvido pela OpenAI que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Ele incorpora o processamento de linguagem natural e a compreensão visual. Com o modo aprimorado, você pode usar os recursos da Visão de IA do Azure para gerar insights adicionais das imagens.

novembrod e 2023

Novo suporte à fonte de dados no Azure OpenAI On Your Data

  • Agora você pode usar o Azure Cosmos DB para MongoDB vCore, bem como URLs/endereços Web, como fontes de dados para ingerir seus dados e conversar com um modelo compatível do Azure OpenAI.

GPT-4 Turbo Preview e GPT-3.5-Turbo-1106 lançado

Ambos os modelos são a versão mais recente do OpenAI com instruções aprimoradas a seguir, modo JSON, saída reproduzível e chamada de função paralela.

  • O GPT-4 Turbo Preview tem uma janela de máxima contexto de 128.000 tokens e pode gerar 4.096 tokens de saída. Ele tem os dados de treinamento mais recentes com conhecimento até abril de 2023. Esse modelo está em versão prévia e não é recomendado para uso em produção. Todas as implantações desse modelo de versão prévia serão atualizadas automaticamente quando a versão estável estiver disponível.

  • O GPT-3.5-Turbo-1106 tem uma janela máxima de contexto de 16.385 tokens e pode gerar 4.096 tokens de saída.

Para obter informações sobre a disponibilidade regional do modelo, consulte a página de modelos.

Os modelos têm suas próprias alocações de cota exclusivas por região.

Versão prévia pública do DALL-E 3

O DALL-E 3 é o modelo de geração de imagem mais recente do OpenAI. Ele apresenta qualidade de imagem aprimorada, cenas mais complexas e melhor desempenho ao renderizar texto em imagens. Ele também vem com mais opções de taxa de proporção. O DALL-E 3 está disponível por meio do OpenAI Studio e da API REST. Seu recurso OpenAI deve estar na região do Azure SwedenCentral.

O DALL-E 3 inclui a reescrita de prompt interna para aprimorar imagens, reduzir o viés e aumentar a variação natural.

Experimente o DALL-E 3 seguindo o início rápido.

IA responsável

  • Configurabilidade expandida do cliente: todos os clientes do OpenAI do Azure agora podem configurar todos os níveis de gravidade (baixo, médio, alto) para as categorias ódio, violência, sexual e automutilação, incluindo filtrar apenas conteúdo de alta gravidade. Configurar os filtros de conteúdo

  • Credenciais de conteúdo em todos os modelos DALL-E: as imagens geradas por IA de todos os modelos DALL-E agora incluem uma credencial digital que divulga o conteúdo como gerado por IA. Os aplicativos que mostram ativos de imagem podem tirar proveito do SDK da Iniciativa de Autenticidade de Conteúdo de código aberto para mostrar credenciais nas respectivas imagens geradas por IA. Credenciais de conteúdo no OpenAI do Azure

  • Novos modelos de RAI

    • Detecção do risco de jailbreak: ataques de jailbreak são prompts de usuário projetados para provocar o modelo de IA generativa e forçá-lo a exibir os comportamentos que foi treinado a evitar ou romper as regras definidas na Mensagem do Sistema. O modelo de detecção do risco de jailbreak é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos prompts de usuário.
    • Texto de material protegido: o texto de material protegido descreve um conteúdo de texto conhecido (por exemplo, letras de música, artigos, receitas culinárias e conteúdo web selecionado) que pode ser gerado por modelos de linguagem grandes. O modelo de texto de material protegido é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos preenchimentos de LLMs.
    • Código de material protegido: o código de material protegido descreve o código-fonte que corresponde a um conjunto de códigos-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem citar adequadamente os repositórios de origem. O modelo de código de material protegido é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos preenchimentos de LLMs.

    Configurar os filtros de conteúdo

  • Listas de bloqueios: os clientes agora podem rapidamente personalizar ainda mais o comportamento do filtro de conteúdo para prompts e preenchimentos criando uma lista de bloqueios personalizada nos respectivos filtros. A lista de bloqueios personalizada permite que o filtro tome providências com relação a uma lista de padrões personalizada, incluindo, por exemplo, termos ou padrões de regex específicos. Além das listas de bloqueio personalizadas, fornecemos uma lista da Microsoft, em inglês, de palavrões a serem bloqueados. Usar listas de bloqueio

Outubro de 2023

Novos modelos de ajuste fino (versão prévia)

Azure OpenAI On Your Data

  • Novos parâmetros personalizados para determinar o número de documentos recuperados e a rigidez.
    • A configuração de rigidez define o limite para categorizar os documentos como relevantes para suas consultas.
    • A configuração de documentos recuperados especifica o número de documentos de maior pontuação do índice de dados usados para gerar respostas.
  • Você pode ver o status de ingestão/upload de dados no Estúdio de OpenAI do Azure.
  • Suporte para pontos de extremidade privados e VPNs e para contêineres de blob.

Setembro de 2023

GPT-4

GPT-4 e GPT-4-32k agora estão disponíveis para todos os clientes do Serviço OpenAI do Azure. Os clientes não precisam mais se aplicar para a lista de espera para usar o GPT-4 e GPT-4-32k (os requisitos de registro de Acesso Limitado continuam sendo aplicados a todos os modelos do OpenAI do Azure). A disponibilidade pode variar de acordo com a região. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Instrução Turbo GPT-3.5

O Serviço OpenAI do Azure já dá suporte ao modelo de Instrução Turbo GPT-3.5. Esse modelo tem um desempenho comparável a text-davinci-003 e está disponível para ser usado com a API de Conclusões. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Visualização pública do Whisper

O Serviço OpenAI do Azure agora dá suporte a APIs de conversão de fala em texto do modelo Whisper da plataforma OpenAI. Obtenha o texto gerado por IA com base no áudio da fala que você fornecer. Para saber mais, confira este início rápido.

Observação

A Fala de IA do Azure também dá suporte ao modelo Whisper da OpenAI por meio da API de transcrição em lote. Para obter mais informações, verifique o guia Criar uma transcrição em lote. Confira O que é o modelo Whisper? para saber mais sobre quando usar a Fala de IA do Azure versus o Serviço OpenAI do Azure.

Novas regiões

  • O OpenAI do Azure agora também está disponível nas regiões Suécia Central e Norte da Suíça. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Aumentos dos limites de cota regional

  • Aumenta para os limites máximos de cota padrão para determinados modelos e regiões. Migrar as cargas de trabalho para esses modelos e regiões permitirá que você aproveite maiores Tokens por minuto (TPM).

Agosto de 2023

Atualizações do Azure OpenAI em seus próprios dados (visualização)

Julho de 2023

Suporte para chamada de função

Inserindo o aumento da matriz de entrada

Novas regiões

  • O Azure OpenAI agora também está disponível nas regiões Leste do Canadá, Leste dos EUA 2, Leste do Japão e Centro-Norte dos EUA. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Junho de 2023

Como usar o OpenAI do Azure em seus próprios dados (versão prévia)

  • O Azure OpenAI On Your Data agora está disponível em versão prévia, permitindo que você converse com modelos do OpenAI, como GPT-35-Turbo e GPT-4, e receba respostas com base em seus dados.

Novas versões dos modelos gpt-35-turbo e gpt-4

  • gpt-35-turbo (versão 0613)
  • gpt-35-turbo-16k (versão 0613)
  • gpt-4 (versão 0613)
  • gpt-4-32k (versão 0613)

Sul do Reino Unido

  • O Azure OpenAI agora está disponível na região do Sul do Reino Unido. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Filtragem de conteúdo e anotações (versão prévia)

Quota

Maio de 2023

Suporte ao SDK Java e JavaScript

  • NOVOS SDKs de versão prévia do OpenAI do Azure que oferecem suporte para JavaScript e Java.

Disponibilidade Geral de Conclusão de Chat do OpenAI do Azure (GA)

  • Suporte da disponibilidade geral para:
    • Versão da API de Conclusão de Chat2023-05-15.
    • Modelos GPT-35-Turbo.
    • Série do modelo GPT-4.

Se você estiver usando a API 2023-03-15-preview, recomendamos a migração para a API 2023-05-15 em GA. Se você estiver usando a versão da API 2022-12-01 no momento, essa API permanecerá em GA, mas não incluirá os recursos mais recentes de Conclusão de Chat.

Importante

O uso das versões atuais dos modelos GPT-35-Turbo com o ponto de extremidade de conclusão permanece em versão prévia.

França Central

  • O Azure OpenAI agora está disponível na região da França Central. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Abril de 2022

  • Versão prévia pública do DALL-E 2. O Serviço OpenAI do Azure agora dá suporte a APIs de geração de imagem alimentadas pelo modelo DALL-E 2 do OpenAI. Obtenha imagens geradas por IA com base no texto descritivo que você fornecer. Para saber mais, confira este início rápido. Para solicitar acesso, os clientes existentes do OpenAI do Azure podem se inscrever preenchendo esse formulário.

  • As implantações inativas de modelos personalizados serão agora excluídas após 15 dias; os modelos permanecerão disponíveis para reimplantação. Se um modelo personalizado (ajustado) for implantado por mais de quinze (15) dias durante os quais não sejam feitas chamadas de conclusão ou chat, a implantação será automaticamente excluída (e não serão cobradas mais taxas de hospedagem por essa implantação). O modelo personalizado subjacente permanecerá disponível e poderá ser reimplantado a qualquer momento. Para saber mais, confira o artigo de instruções.

Março de 2023

  • Os modelos da série GPT-4 agora estão disponíveis em versão prévia no OpenAI do Azure. Para solicitar acesso, os clientes existentes do OpenAI do Azure podem se inscrever preenchendo esse formulário. Atualmente, esses modelos estão disponíveis nas regiões Leste dos EUA e Centro-Sul dos EUA.

  • Nova API de Preenchimento para os modelos GPT-35-Turbo e GPT-4 lançada em versão prévia em 21/03. Para saber mais, confira os guias de início rápido atualizados e o artigo de instruções.

  • Versão prévia do GPT-35-Turbo. Para saber mais, confira o artigo de instruções.

  • Maiores limites de treinamento para ajuste fino: o tamanho máximo do trabalho de treinamento (tokens no arquivo de treinamento) x (n.º de épocas) é de 2 bilhões de tokens para todos os modelos. Também aumentamos o trabalho de treinamento máximo de 120 para 720 horas.

  • Adicionando casos de uso adicionais ao seu acesso existente.  Anteriormente, o processo para adicionar novos casos de uso exigia que os clientes se inscrevessem novamente no serviço. Agora, estamos lançando um novo processo que permite adicionar rapidamente novos casos de uso ao uso do serviço. Esse processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure. Os clientes existentes podem atestar todos os novos casos de uso aqui. Observe que isso é necessário sempre que você quiser usar o serviço para um novo caso de uso para o qual não se inscreveu originalmente.

Fevereiro de 2023

Novos recursos

Atualizações

  • A filtragem de conteúdo está ativada por padrão.

Novos artigos sobre:

Novo curso de treinamento:

Janeiro de 2023

Novos recursos

  • Disponibilidade geral do serviço. O Serviço OpenAI do Azure agora está em disponibilidade geral.​

  • Novos modelos: adição do modelo de texto mais recente, text-davinci-003 (Leste dos EUA, Oeste da Europa), text-ada-embeddings-002 (Leste dos EUA, Centro-Sul dos EUA, Oeste da Europa)

Dezembro de 2022

Novos recursos

  • Os modelos mais recentes do OpenAI. O OpenAI do Azure fornece acesso a todos os modelos mais recentes, incluindo a série GPT-3.5.

  • Nova versão de API (2022-12-01). Essa atualização inclui vários aprimoramentos solicitados, incluindo informações de uso de token na resposta à API, mensagens de erro aprimoradas para arquivos, alinhamento com o OpenAI na estrutura de dados de criação de ajuste e suporte para o parâmetro de sufixo a fim de permitir a nomenclatura personalizada de trabalhos ajustados. ​

  • Limites de solicitação mais altos por segundo. 50 para modelos não Davinci. 20 para modelos Davinci.

  • Implantações mais rápidas de ajuste. Implante modelos ajustados por Ada e Curie em menos de 10 minutos.

  • Limites de treinamento mais altos: tokens de treinamento de 40 milhões para Ada, Babbage e Curie. 10 milhões para Davinci.

  • Processo para solicitar modificações no uso indevido e no abuso do log de dados e da revisão humana. Hoje, o serviço registra em log os dados de solicitação/resposta para fins de detecção de abuso e uso indevido, a fim de garantir que esses modelos sofisticados não sejam indevidamente utilizados. No entanto, muitos clientes têm requisitos estritos de privacidade e segurança de dados que exigem maior controle sobre os dados. Para dar suporte a esses casos de uso, estamos lançando um novo processo para que os clientes modifiquem as políticas de filtragem de conteúdo ou desativem o log de abuso para casos de uso de baixo risco. Esse processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure e os clientes existentes do OpenAI podem enviar uma solicitação aqui.

  • Criptografia de CMK (chave gerenciada pelo cliente). A CMK fornece aos clientes maior controle sobre o gerenciamento dos dados no Serviço OpenAI do Azure, fornecendo chaves de criptografia exclusivas usadas para armazenar dados de treinamento e modelos personalizados. As Chaves Gerenciadas pelo Cliente (CMK), também conhecidas como Bring Your Own Key (BYOK), oferecem maior flexibilidade para criar, girar, desabilitar e revogar controles de acesso. Você também pode auditar as chaves de criptografia usadas para proteger seus dados. Saiba mais em nossa documentação sobre a criptografia em repouso.

  • Suporte ao Sistema de Proteção de Dados

  • Conformidade com o SOC-2

  • Log e diagnóstico por meio das configurações de Diagnóstico e Métricas, do Azure Resource Health e da Análise de Custos..

  • Aprimoramentos do Studio. Vários aprimoramentos de usabilidade no fluxo de trabalho do Studio, incluindo o suporte à função do Azure AD para controlar quem na equipe tem acesso para criar e implantar modelos ajustados.

Alterações (interruptivas)

A solicitação de API de criação de ajuste refinado foi atualizada para corresponder ao esquema do OpenAI.

Versões prévias da API:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

Versão da API 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

A filtragem de conteúdo está temporariamente desativada por padrão. A moderação de conteúdo do Azure funciona de maneira diferente do OpenAI do Azure. O OpenAI do Azure executa filtros de conteúdo durante a chamada de geração para detectar conteúdo prejudicial ou abusivo e os filtra da resposta. Saiba mais

Esses modelos serão habilitados novamente no primeiro trimestre de 2023 e estarão ativados por padrão. ​

Ações do cliente

Próximas etapas

Saiba mais sobre os modelos subjacentes que alimentam o OpenAI do Azure.