Novidades do Serviço OpenAI do Azure

Artigo
04/18/2024

Abril de 2024

O ajuste fino agora tem suporte em duas novas regiões: Leste dos EUA 2 e Oeste da Suíça

O ajuste fino agora está disponível com suporte para:

Leste dos EUA 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Oeste da Suíça

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos e o suporte para ajuste fino em cada região.

Exemplos de treinamento de chat de vários turnos

O ajuste fino agora dá suporte a exemplos de treinamento de chat de vários turnos.

O GPT-4 (0125) está disponível para o OpenAI do Azure em seus Dados

Agora você já pode usar o modelo GPT-4 (0125) nas regiões disponíveis com o OpenAI do Azure em seus Dados.

Março de 2024

Monitoramento de riscos e de segurança no estúdio do OpenAI do Azure

O estúdio do OpenAI do Azure agora fornece um painel de riscos e de segurança para cada uma das implantações que utiliza uma configuração de filtro de conteúdo. Utilize-o para verificar os resultados da atividade de filtragem. Em seguida, você poderá ajustar a configuração de filtro para atender melhor às suas necessidades de negócios e atender aos princípios de IA Responsável.

Usar monitoramento de riscos e de segurança

Atualizações do Azure OpenAI On Your Data

Agora, você poderá conectar um banco de dados vetorial Elasticsearch para utilizar com o Azure OpenAI On Your Data.
Você pode usar o parâmetro de tamanho da parte durante a ingestão de dados para definir o número máximo de tokens de qualquer parte dos dados fornecidos em seu índice.

GA (disponibilidade geral) da API lançada em 01/02/2024

Esta é a versão mais recente da API GA e é a substituição da versão GA anterior 2023-05-15. Essa versão adiciona suporte para os recursos em GA do OpenAI do Azure mais recentes, como Whisper, DALL-E 3, ajuste fino, On Your Data, etc.

Recursos que ainda estão em versão prévia, como Assistentes, TTS (conversão de texto em fala), determinados em suas fontes de dados, ainda exigem uma versão prévia da API. Para obter mais informações, confira nosso guia de ciclo de vida da versão da API.

Disponibilidade geral do Whisper (GA)

O modelo de conversão de fala em texto do Whisper agora está em GA para REST e Python. Os SDKs da biblioteca de clientes ainda estão em versão prévia pública.

Experimente Whisper seguindo um início rápido.

disponibilidade geral (GA) do DALL-E 3

O modelo de geração de imagem DALL-E 3 agora está em GA para REST e Python. Os SDKs da biblioteca de clientes ainda estão em versão prévia pública.

Experimente o DALL-E 3 seguindo o início rápido.

Novo suporte regional para DALL-E 3

Agora você pode acessar o DALL-E 3 com um recurso do OpenAI do Azure na região do Azure East US no AustraliaEast, além de SwedenCentral.

Substituições e desativações do modelo

Adicionamos uma página para acompanhar as substituições e desativações de modelo no Serviço OpenAI do Azure. Esta página fornece informações sobre os modelos que estão disponíveis, preteridos e desativados no momento.

API 2024-03-01-preview lançada

2024-03-01-preview tem todas as mesmas funcionalidades que 2024-02-15-preview e adiciona dois novos parâmetros para inserções:

encoding_format permite especificar o formato para gerar inserções em floatou base64. O padrão é float.
dimensions permite definir o número de inserções de saída. Esse parâmetro só tem suporte com os novos modelos de incorporação de terceira geração: text-embedding-3-large, text-embedding-3-small. Normalmente, inserções maiores são mais caras de uma perspectiva de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo e o desempenho gerais. Não há suporte para o parâmetro dimensions em todas as versões da biblioteca OpenAI 1.x Python. Para aproveitar esse parâmetro, recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

Se você estiver usando uma versão prévia da API para aproveitar os recursos mais recentes, recomendamos consultar o artigo ciclo de vida da versão da API para acompanhar por quanto tempo a versão atual da API terá suporte.

Atualizar para planos de atualização GPT-4-1106-Preview

A atualização de implantação de gpt-4 1106-Preview para gpt-4 0125-Preview agendada para 8 de março de 2024 não está mais ocorrendo. As implantações das versões gpt-4 1106-Preview e 0125-Preview definidas como "Atualização automática para padrão" e "Atualizar quando expirado" começarão a ser atualizadas após o lançamento da versão estável.

Para obter mais informações sobre o processo de atualização, consulte a página modelos.

Fevereiro de 2024

Disponibilidade do modelo GPT-3.5-turbo-0125

O modelo tem vários aprimoramentos, incluindo maior precisão na resposta em formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função que não são em inglês.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Modelos de incorporações de terceira geração disponíveis

text-embedding-3-large
text-embedding-3-small

Em testes, o OpenAI relata que os modelos de inserções de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação de vários idiomas com o parâmetro de comparação MIRACL, mantendo ainda o desempenho para tarefas em inglês com o parâmetro de comparação MTEBdo que o modelo de segunda geração text-embedding-ada-002.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Consolidação da cota do GPT-3.5 Turbo

Para simplificar a migração entre diferentes versões dos modelos GPT-3.5-Turbo (incluindo 16k), consolidaremos toda a cota GPT-3.5-Turbo em um único valor de cota.

Todos os clientes que tiverem aumentado a cota aprovada terão cota total combinada que reflete os aumentos anteriores.
Qualquer cliente cujo uso total atual entre versões de modelo é menor que o padrão obterá uma nova cota total combinada por padrão.

Modelo de GPT-4-0125 versão prévia disponível

A versão gpt-4 do modelo 0125-preview agora está disponível no Serviço OpenAI do Azure nas regiões Leste dos EUA, Centro-Norte dos EUA e Centro-Sul dos EUA. Os clientes com implantações de gpt-4 versão 1106-preview serão atualizados automaticamente para0125-preview nas próximas semanas.

Para obter informações sobre a disponibilidade regional do modelo e as atualizações, consulte a página de modelos .

Visualização pública da API de Assistentes

A OpenAI do Azure agora dá suporte à API que alimenta os GPTs do OpenAI. Os Assistentes OpenAI do Azure (versão prévia) permitem que você crie assistentes de IA adaptados às suas necessidades por meio de instruções personalizadas e ferramentas avançadas, como o interpretador de códigos e funções personalizadas. Para obter mais informações, consulte:

Versão prévia das vozes da conversão de texto em fala do OpenAI

O Serviço OpenAI do Azure agora dá suporte a APIs de conversão de texto em fala com as vozes do OpenAI. Obtenha a fala gerada por IA do texto que você fornece. Para saber mais, consulte o guia de visão geral e experimente o início rápido.

Observação

A Fala de IA do Azure também dá suporte às vozes da conversão de texto em fala do OpenAI. Para saber mais, consulte o guia Vozes da conversão de texto em fala do OpenAI por meio do Serviço OpenAI do Azure ou Fala de IA do Azure.

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o OpenAI do Azure em seus dados

Agora você pode usar o Azure OpenAI On Your Data na seguinte região do Azure:

Norte da África do Sul

Disponibilidade geral do Azure OpenAI On Your Data

O Azure OpenAI On Your Data agora está em disponibilidade geral.

Dezembro de 2023

Azure OpenAI On Your Data

Suporte completo de VPN e ponto de extremidade privado para o Azure OpenAI On Your Data, incluindo suporte de segurança para: contas de armazenamento, recursos do OpenAI do Azure e recursos de serviço da Pesquisa de IA do Azure.
Novo artigo para usar Azure OpenAI On Your Data com segurança protegendo dados com redes virtuais e pontos de extremidade privados.

GPT-4 Turbo com Visão agora disponível

O GPT-4 Turbo com Visão no serviço Azure OpenAI agora está em versão prévia pública. O GPT-4 Turbo with Vision é um grande modelo multimodal (LMM) desenvolvido pela OpenAI que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Ele incorpora o processamento de linguagem natural e a compreensão visual. Com o modo aprimorado, você pode usar os recursos da Visão de IA do Azure para gerar insights adicionais das imagens.

Explore os recursos do GPT-4 Turbo com Visão em uma experiência sem código usando o Playground do Azure OpenAI. Saiba mais no Guia de início rápido.
O aprimoramento da visão usando o GPT-4 Turbo com Visão agora está disponível no Playground do Azure OpenAI e inclui suporte para reconhecimento óptico de caracteres, aterramento de objetos, suporte à imagem para "adicionar seus dados" e suporte para prompt de vídeo.
Faça chamadas para a API de chat diretamente usando a API REST.
A disponibilidade da região está atualmente limitada a SwitzerlandNorth, SwedenCentral, WestUS e AustraliaEast
Saiba mais sobre as limitações conhecidas do GPT-4 Turbo com Visão e outras perguntas frequentes.

novembrod e 2023

Novo suporte à fonte de dados no Azure OpenAI On Your Data

Agora você pode usar o Azure Cosmos DB para MongoDB vCore, bem como URLs/endereços Web, como fontes de dados para ingerir seus dados e conversar com um modelo compatível do Azure OpenAI.

GPT-4 Turbo Preview e GPT-3.5-Turbo-1106 lançado

Ambos os modelos são a versão mais recente do OpenAI com instruções aprimoradas a seguir, modo JSON, saída reproduzível e chamada de função paralela.

O GPT-4 Turbo Preview tem uma janela de máxima contexto de 128.000 tokens e pode gerar 4.096 tokens de saída. Ele tem os dados de treinamento mais recentes com conhecimento até abril de 2023. Esse modelo está em versão prévia e não é recomendado para uso em produção. Todas as implantações desse modelo de versão prévia serão atualizadas automaticamente quando a versão estável estiver disponível.
O GPT-3.5-Turbo-1106 tem uma janela máxima de contexto de 16.385 tokens e pode gerar 4.096 tokens de saída.

Para obter informações sobre a disponibilidade regional do modelo, consulte a página de modelos.

Os modelos têm suas próprias alocações de cota exclusivas por região.

Versão prévia pública do DALL-E 3

O DALL-E 3 é o modelo de geração de imagem mais recente do OpenAI. Ele apresenta qualidade de imagem aprimorada, cenas mais complexas e melhor desempenho ao renderizar texto em imagens. Ele também vem com mais opções de taxa de proporção. O DALL-E 3 está disponível por meio do OpenAI Studio e da API REST. Seu recurso OpenAI deve estar na região do Azure SwedenCentral.

O DALL-E 3 inclui a reescrita de prompt interna para aprimorar imagens, reduzir o viés e aumentar a variação natural.

Experimente o DALL-E 3 seguindo o início rápido.

IA responsável

Configurabilidade expandida do cliente: todos os clientes do OpenAI do Azure agora podem configurar todos os níveis de gravidade (baixo, médio, alto) para as categorias ódio, violência, sexual e automutilação, incluindo filtrar apenas conteúdo de alta gravidade. Configurar os filtros de conteúdo
Credenciais de conteúdo em todos os modelos DALL-E: as imagens geradas por IA de todos os modelos DALL-E agora incluem uma credencial digital que divulga o conteúdo como gerado por IA. Os aplicativos que mostram ativos de imagem podem tirar proveito do SDK da Iniciativa de Autenticidade de Conteúdo de código aberto para mostrar credenciais nas respectivas imagens geradas por IA. Credenciais de conteúdo no OpenAI do Azure
Novos modelos de RAI
- Detecção do risco de jailbreak: ataques de jailbreak são prompts de usuário projetados para provocar o modelo de IA generativa e forçá-lo a exibir os comportamentos que foi treinado a evitar ou romper as regras definidas na Mensagem do Sistema. O modelo de detecção do risco de jailbreak é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos prompts de usuário.
- Texto de material protegido: o texto de material protegido descreve um conteúdo de texto conhecido (por exemplo, letras de música, artigos, receitas culinárias e conteúdo web selecionado) que pode ser gerado por modelos de linguagem grandes. O modelo de texto de material protegido é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos preenchimentos de LLMs.
- Código de material protegido: o código de material protegido descreve o código-fonte que corresponde a um conjunto de códigos-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem citar adequadamente os repositórios de origem. O modelo de código de material protegido é opcional (o padrão é desativado) e está disponível no modelo de anotações e filtro. É executado nos preenchimentos de LLMs.
Configurar os filtros de conteúdo
Listas de bloqueios: os clientes agora podem rapidamente personalizar ainda mais o comportamento do filtro de conteúdo para prompts e preenchimentos criando uma lista de bloqueios personalizada nos respectivos filtros. A lista de bloqueios personalizada permite que o filtro tome providências com relação a uma lista de padrões personalizada, incluindo, por exemplo, termos ou padrões de regex específicos. Além das listas de bloqueio personalizadas, fornecemos uma lista da Microsoft, em inglês, de palavrões a serem bloqueados. Usar listas de bloqueio

Outubro de 2023

Novos modelos de ajuste fino (versão prévia)

gpt-35-turbo-0613 está agora disponível para ajuste fino.
babbage-002 e davinci-002 estão agora disponíveis para ajuste fino. Esses modelos substituem os modelos de base herdados ada, babbage, curie e davinci que estavam disponíveis anteriormente para ajuste fino.
A disponibilidade de ajuste fino está limitada a determinadas regiões. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.
Os modelos ajustados têm limites de cota diferentes dos modelos regulares.
Tutorial: Ajuste fino do GPT-3.5-turbo

Azure OpenAI On Your Data

Novos parâmetros personalizados para determinar o número de documentos recuperados e a rigidez.
- A configuração de rigidez define o limite para categorizar os documentos como relevantes para suas consultas.
- A configuração de documentos recuperados especifica o número de documentos de maior pontuação do índice de dados usados para gerar respostas.
Você pode ver o status de ingestão/upload de dados no Estúdio de OpenAI do Azure.
Suporte para pontos de extremidade privados e VPNs e para contêineres de blob.

Setembro de 2023

GPT-4

GPT-4 e GPT-4-32k agora estão disponíveis para todos os clientes do Serviço OpenAI do Azure. Os clientes não precisam mais se aplicar para a lista de espera para usar o GPT-4 e GPT-4-32k (os requisitos de registro de Acesso Limitado continuam sendo aplicados a todos os modelos do OpenAI do Azure). A disponibilidade pode variar de acordo com a região. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Instrução Turbo GPT-3.5

O Serviço OpenAI do Azure já dá suporte ao modelo de Instrução Turbo GPT-3.5. Esse modelo tem um desempenho comparável a text-davinci-003 e está disponível para ser usado com a API de Conclusões. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Visualização pública do Whisper

O Serviço OpenAI do Azure agora dá suporte a APIs de conversão de fala em texto do modelo Whisper da plataforma OpenAI. Obtenha o texto gerado por IA com base no áudio da fala que você fornecer. Para saber mais, confira este início rápido.

Observação

A Fala de IA do Azure também dá suporte ao modelo Whisper da OpenAI por meio da API de transcrição em lote. Para obter mais informações, verifique o guia Criar uma transcrição em lote. Confira O que é o modelo Whisper? para saber mais sobre quando usar a Fala de IA do Azure versus o Serviço OpenAI do Azure.

Novas regiões

O OpenAI do Azure agora também está disponível nas regiões Suécia Central e Norte da Suíça. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Aumentos dos limites de cota regional

Aumenta para os limites máximos de cota padrão para determinados modelos e regiões. Migrar as cargas de trabalho para esses modelos e regiões permitirá que você aproveite maiores Tokens por minuto (TPM).

Agosto de 2023

Atualizações do Azure OpenAI em seus próprios dados (visualização)

Agora você pode implantar o Azure OpenAI On Your Data no Power Virtual Agents.
O Azure OpenAI On Your Data agora dá suporte a pontos de extremidade privados.
Capacidade de filtrar o acesso a documentos confidenciais.
Atualize automaticamente seu índice de acordo com uma programação.
Busca em vetores e opções de pesquisa semântica.
Veja seu histórico de chat no aplicativo web implantado

Julho de 2023

Suporte para chamada de função

O Azure OpenAI agora dá suporte à chamada de função para permitir que você trabalhe com funções na API de conclusões de chat.

Inserindo o aumento da matriz de entrada

O OpenAI do Azure agora dá suporte a matrizes com até 16 entradas por solicitação de API com text-embedding-ada-002 Versão 2.

Novas regiões

O Azure OpenAI agora também está disponível nas regiões Leste do Canadá, Leste dos EUA 2, Leste do Japão e Centro-Norte dos EUA. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Junho de 2023

Como usar o OpenAI do Azure em seus próprios dados (versão prévia)

O Azure OpenAI On Your Data agora está disponível em versão prévia, permitindo que você converse com modelos do OpenAI, como GPT-35-Turbo e GPT-4, e receba respostas com base em seus dados.

Novas versões dos modelos gpt-35-turbo e gpt-4

gpt-35-turbo (versão 0613)
gpt-35-turbo-16k (versão 0613)
gpt-4 (versão 0613)
gpt-4-32k (versão 0613)

Sul do Reino Unido

O Azure OpenAI agora está disponível na região do Sul do Reino Unido. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Filtragem de conteúdo e anotações (versão prévia)

Como configurar filtros de conteúdo com o Serviço OpenAI do Azure.
Habilite anotações para exibir informações de categoria e gravidade de filtragem de conteúdo como parte de suas chamadas de Conclusão e Conclusão de Chat baseadas em GPT.

Quota

A cota fornece a flexibilidade para gerenciar ativamente a alocação de limites de taxa entre as implantações em sua assinatura.

Maio de 2023

Suporte ao SDK Java e JavaScript

NOVOS SDKs de versão prévia do OpenAI do Azure que oferecem suporte para JavaScript e Java.

Disponibilidade Geral de Conclusão de Chat do OpenAI do Azure (GA)

Suporte da disponibilidade geral para:
- Versão da API de Conclusão de Chat2023-05-15.
- Modelos GPT-35-Turbo.
- Série do modelo GPT-4.

Se você estiver usando a API 2023-03-15-preview, recomendamos a migração para a API 2023-05-15 em GA. Se você estiver usando a versão da API 2022-12-01 no momento, essa API permanecerá em GA, mas não incluirá os recursos mais recentes de Conclusão de Chat.

Importante

O uso das versões atuais dos modelos GPT-35-Turbo com o ponto de extremidade de conclusão permanece em versão prévia.

França Central

O Azure OpenAI agora está disponível na região da França Central. Verifique a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo em cada região.

Abril de 2022

Versão prévia pública do DALL-E 2. O Serviço OpenAI do Azure agora dá suporte a APIs de geração de imagem alimentadas pelo modelo DALL-E 2 do OpenAI. Obtenha imagens geradas por IA com base no texto descritivo que você fornecer. Para saber mais, confira este início rápido. Para solicitar acesso, os clientes existentes do OpenAI do Azure podem se inscrever preenchendo esse formulário.
As implantações inativas de modelos personalizados serão agora excluídas após 15 dias; os modelos permanecerão disponíveis para reimplantação. Se um modelo personalizado (ajustado) for implantado por mais de quinze (15) dias durante os quais não sejam feitas chamadas de conclusão ou chat, a implantação será automaticamente excluída (e não serão cobradas mais taxas de hospedagem por essa implantação). O modelo personalizado subjacente permanecerá disponível e poderá ser reimplantado a qualquer momento. Para saber mais, confira o artigo de instruções.

Março de 2023

Os modelos da série GPT-4 agora estão disponíveis em versão prévia no OpenAI do Azure. Para solicitar acesso, os clientes existentes do OpenAI do Azure podem se inscrever preenchendo esse formulário. Atualmente, esses modelos estão disponíveis nas regiões Leste dos EUA e Centro-Sul dos EUA.
Nova API de Preenchimento para os modelos GPT-35-Turbo e GPT-4 lançada em versão prévia em 21/03. Para saber mais, confira os guias de início rápido atualizados e o artigo de instruções.
Versão prévia do GPT-35-Turbo. Para saber mais, confira o artigo de instruções.
Maiores limites de treinamento para ajuste fino: o tamanho máximo do trabalho de treinamento (tokens no arquivo de treinamento) x (n.º de épocas) é de 2 bilhões de tokens para todos os modelos. Também aumentamos o trabalho de treinamento máximo de 120 para 720 horas.
Adicionando casos de uso adicionais ao seu acesso existente. Anteriormente, o processo para adicionar novos casos de uso exigia que os clientes se inscrevessem novamente no serviço. Agora, estamos lançando um novo processo que permite adicionar rapidamente novos casos de uso ao uso do serviço. Esse processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure. Os clientes existentes podem atestar todos os novos casos de uso aqui. Observe que isso é necessário sempre que você quiser usar o serviço para um novo caso de uso para o qual não se inscreveu originalmente.

Fevereiro de 2023

Novos recursos

Exemplos de | versão prévia do SDK do .NET (inference)
Atualização do SDK do Terraform para dar suporte a operações de gerenciamento do OpenAI do Azure.
Agora há suporte para a inserção de texto no final de uma conclusão com o parâmetro suffix.

Atualizações

A filtragem de conteúdo está ativada por padrão.

Novos artigos sobre:

Novo curso de treinamento:

Introdução ao OpenAI do Azure

Janeiro de 2023

Novos recursos

Disponibilidade geral do serviço. O Serviço OpenAI do Azure agora está em disponibilidade geral.
Novos modelos: adição do modelo de texto mais recente, text-davinci-003 (Leste dos EUA, Oeste da Europa), text-ada-embeddings-002 (Leste dos EUA, Centro-Sul dos EUA, Oeste da Europa)

Dezembro de 2022

Novos recursos

Os modelos mais recentes do OpenAI. O OpenAI do Azure fornece acesso a todos os modelos mais recentes, incluindo a série GPT-3.5.
Nova versão de API (2022-12-01). Essa atualização inclui vários aprimoramentos solicitados, incluindo informações de uso de token na resposta à API, mensagens de erro aprimoradas para arquivos, alinhamento com o OpenAI na estrutura de dados de criação de ajuste e suporte para o parâmetro de sufixo a fim de permitir a nomenclatura personalizada de trabalhos ajustados.
Limites de solicitação mais altos por segundo. 50 para modelos não Davinci. 20 para modelos Davinci.
Implantações mais rápidas de ajuste. Implante modelos ajustados por Ada e Curie em menos de 10 minutos.
Limites de treinamento mais altos: tokens de treinamento de 40 milhões para Ada, Babbage e Curie. 10 milhões para Davinci.
Processo para solicitar modificações no uso indevido e no abuso do log de dados e da revisão humana. Hoje, o serviço registra em log os dados de solicitação/resposta para fins de detecção de abuso e uso indevido, a fim de garantir que esses modelos sofisticados não sejam indevidamente utilizados. No entanto, muitos clientes têm requisitos estritos de privacidade e segurança de dados que exigem maior controle sobre os dados. Para dar suporte a esses casos de uso, estamos lançando um novo processo para que os clientes modifiquem as políticas de filtragem de conteúdo ou desativem o log de abuso para casos de uso de baixo risco. Esse processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure e os clientes existentes do OpenAI podem enviar uma solicitação aqui.
Criptografia de CMK (chave gerenciada pelo cliente). A CMK fornece aos clientes maior controle sobre o gerenciamento dos dados no Serviço OpenAI do Azure, fornecendo chaves de criptografia exclusivas usadas para armazenar dados de treinamento e modelos personalizados. As Chaves Gerenciadas pelo Cliente (CMK), também conhecidas como Bring Your Own Key (BYOK), oferecem maior flexibilidade para criar, girar, desabilitar e revogar controles de acesso. Você também pode auditar as chaves de criptografia usadas para proteger seus dados. Saiba mais em nossa documentação sobre a criptografia em repouso.
Suporte ao Sistema de Proteção de Dados
Conformidade com o SOC-2
Log e diagnóstico por meio das configurações de Diagnóstico e Métricas, do Azure Resource Health e da Análise de Custos..
Aprimoramentos do Studio. Vários aprimoramentos de usabilidade no fluxo de trabalho do Studio, incluindo o suporte à função do Azure AD para controlar quem na equipe tem acesso para criar e implantar modelos ajustados.

Alterações (interruptivas)

A solicitação de API de criação de ajuste refinado foi atualizada para corresponder ao esquema do OpenAI.

Versões prévias da API:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

Versão da API 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

A filtragem de conteúdo está temporariamente desativada por padrão. A moderação de conteúdo do Azure funciona de maneira diferente do OpenAI do Azure. O OpenAI do Azure executa filtros de conteúdo durante a chamada de geração para detectar conteúdo prejudicial ou abusivo e os filtra da resposta. Saiba mais

Esses modelos serão habilitados novamente no primeiro trimestre de 2023 e estarão ativados por padrão.

Ações do cliente

Entre em contato com o Suporte do Azure se desejar que elas sejam ativadas na sua assinatura.
Solicite modificações de filtragem, caso deseje que elas permaneçam desativadas. (Essa opção será somente para casos de uso de baixo risco.)

Próximas etapas

Saiba mais sobre os modelos subjacentes que alimentam o OpenAI do Azure.

Novidades do Serviço OpenAI do Azure

Abril de 2024

O ajuste fino agora tem suporte em duas novas regiões: Leste dos EUA 2 e Oeste da Suíça

Leste dos EUA 2

Oeste da Suíça

Exemplos de treinamento de chat de vários turnos

O GPT-4 (0125) está disponível para o OpenAI do Azure em seus Dados

Março de 2024

Monitoramento de riscos e de segurança no estúdio do OpenAI do Azure

Atualizações do Azure OpenAI On Your Data

GA (disponibilidade geral) da API lançada em 01/02/2024

Disponibilidade geral do Whisper (GA)

disponibilidade geral (GA) do DALL-E 3

Novo suporte regional para DALL-E 3

Substituições e desativações do modelo

API 2024-03-01-preview lançada

Atualizar para planos de atualização GPT-4-1106-Preview

Fevereiro de 2024

Disponibilidade do modelo GPT-3.5-turbo-0125

Modelos de incorporações de terceira geração disponíveis

Consolidação da cota do GPT-3.5 Turbo

Modelo de GPT-4-0125 versão prévia disponível

Visualização pública da API de Assistentes

Versão prévia das vozes da conversão de texto em fala do OpenAI

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o OpenAI do Azure em seus dados

Disponibilidade geral do Azure OpenAI On Your Data

Dezembro de 2023

Azure OpenAI On Your Data

GPT-4 Turbo com Visão agora disponível

novembrod e 2023

Novo suporte à fonte de dados no Azure OpenAI On Your Data

GPT-4 Turbo Preview e GPT-3.5-Turbo-1106 lançado

Versão prévia pública do DALL-E 3

IA responsável

Outubro de 2023

Novos modelos de ajuste fino (versão prévia)

Azure OpenAI On Your Data

Setembro de 2023

GPT-4

Instrução Turbo GPT-3.5

Visualização pública do Whisper

Novas regiões

Aumentos dos limites de cota regional

Agosto de 2023

Atualizações do Azure OpenAI em seus próprios dados (visualização)

Julho de 2023

Suporte para chamada de função

Inserindo o aumento da matriz de entrada

Novas regiões

Junho de 2023

Como usar o OpenAI do Azure em seus próprios dados (versão prévia)

Novas versões dos modelos gpt-35-turbo e gpt-4

Sul do Reino Unido

Filtragem de conteúdo e anotações (versão prévia)

Quota

Maio de 2023

Suporte ao SDK Java e JavaScript

Disponibilidade Geral de Conclusão de Chat do OpenAI do Azure (GA)

França Central

Abril de 2022

Março de 2023

Fevereiro de 2023

Novos recursos

Atualizações

Janeiro de 2023

Novos recursos

Dezembro de 2022

Novos recursos

Alterações (interruptivas)

Próximas etapas

Recursos adicionais