Importar uma API de modelo de idioma

APLICA-SE A: todas as camadas do Gerenciamento de API

Você pode importar endpoints de modelo de linguagem compatíveis com OpenAI para sua instância de Gerenciamento de API ou importar modelos não compatíveis como APIs de passagem direta. Por exemplo, gerencie LLMs auto-hospedados ou aqueles hospedados em provedores de inferência diferentes do Foundry Tools. Use políticas de gateway de IA e outros recursos de Gerenciamento de API para simplificar a integração, melhorar a observabilidade e aprimorar o controle sobre pontos de extremidade de modelo.

Saiba mais sobre como gerenciar APIs de IA no Gerenciamento de API:

Recursos do gateway de IA no API Management do Azure

Tipos de API de modelo de linguagem

O Gerenciamento de API dá suporte a dois tipos de API de modelo de idioma. Escolha a opção que corresponde à implantação do modelo, que determina como os clientes chamam a API e como as solicitações obtêm rota para o serviço de IA.

Compatível com OpenAI – endpoints de modelos de linguagem compatíveis com a API do OpenAI. Exemplos incluem Hugging Face Text Generation Inference (TGI) e API do Google Gemini.

O Gerenciamento de API configura um endpoint para completar chats.
Passthrough – Endpoints de modelo de linguagem não compatíveis com a API do OpenAI. Exemplos incluem modelos implantados na Amazon Bedrock ou em outros provedores.

O Gerenciamento de API configura operações curinga para verbos HTTP comuns. Os clientes podem anexar caminhos a operações com caracteres curinga, e o API Management encaminha as solicitações para o back-end.

Pré-requisitos

Uma instância de Gerenciamento de API existente. Crie uma, se ainda não tiver.
Uma implantação de modelo de linguagem auto-hospedado ou não fornecido pelo serviço de nuvem Azure da Microsoft, com um endpoint de API.

Importar a API do modelo de idioma usando o portal

A importação da API LLM configura automaticamente:

Um recurso de backend e uma política de set-backend-service que direcionam as solicitações para o endpoint LLM.
(opcionalmente) Acesso usando uma chave de acesso (protegida como um valor nomeado em segredo).
(opcionalmente) Políticas para monitorar e gerenciar a API.

Para importar uma API de modelo de idioma:

No portal Azure, acesse sua instância de Gerenciamento de API.
No menu do lado esquerdo, em APIs, selecione APIs>+ Adicionar API.
Em Definir uma nova API, selecione API de Modelo de Idioma.
Na guia Configurar API :
1. Insira um nome de exibição e uma descrição (opcional).
2. Insira a URL da LLM API.
3. Selecione um ou mais Produtos para associar à API (opcional).
4. No Caminho, acrescente o caminho para acessar a API llm.
5. Selecione Criar API openai ou criar uma API de passagem. Consulte os tipos de API do modelo de linguagem.
6. Insira o nome do cabeçalho de autorização e a chave de API (se necessário).
7. Selecione Próximo.
Na guia Gerenciar consumo de token , insira as configurações ou aceite os padrões para as seguintes políticas:
- Gerenciar o consumo de token
- Controlar o uso do token
Na guia Aplicar cache semântico , insira as configurações ou aceite os padrões da política para otimizar o desempenho e reduzir a latência:
- Habilitar o cache semântico de respostas
Na guia AI content safety, insira configurações ou aceite padrões para configurar Azure AI Content Safety para bloquear conteúdo não seguro:
- Impor verificações de segurança de conteúdo em solicitações de LLM
Selecione Examinar.
Após a validação, selecione Criar.

O API Management cria a API e configura as operações para os pontos de extremidade LLM. Por padrão, a API requer uma assinatura de Gerenciamento de API.

Teste a API de LLM

Verifique sua API LLM no console de teste.

Selecione a API que você criou.
Selecione a guia Testar.
Selecione uma operação compatível com a implantação do modelo. Campos para parâmetros e cabeçalhos são exibidos.
Insira parâmetros e cabeçalhos. Dependendo da operação, configure ou atualize um corpo da solicitação conforme necessário.

Observação

O console de teste adiciona automaticamente um cabeçalho Ocp-Apim-Subscription-Key (usando a assinatura interna de todos os acessos), que fornece acesso a cada API. Para exibi-lo, selecione o ícone "olho" ao lado da Solicitação HTTP.
Selecione Enviar.

Quando o teste é bem-sucedido, o back-end retorna dados, incluindo métricas de uso de token para monitorar o consumo do modelo de linguagem.

Recursos do gateway de IA no API Management do Azure

Comentários

Esta página foi útil?

Last updated on 2026-03-16