Compartilhar via


Referência: Inserções | Estúdio de IA do Azure

Importante

Alguns dos recursos descritos nesse artigo podem estar disponíveis apenas na versão prévia. Essa versão prévia é fornecida sem um contrato de nível de serviço e não recomendamos isso para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.

Cria um vetor de inserção que representa o texto de entrada.

POST /embeddings?api-version=2024-04-01-preview

Parâmetros de URI

Nome Em Obrigatório Type Descrição
api-version consulta True string A versão da API no formato "YYYY-MM-DD" ou "YYYYY-MM-DD-preview".

Cabeçalho da solicitação

Nome Obrigatória Type Descrição
parâmetros extras string O comportamento da API quando os parâmetros extras são indicados no conteúdo. Usar pass-through faz com que a API passe o parâmetro para o modelo subjacente. Use esse valor quando quiser passar os parâmetros que você sabe que o modelo subjacente pode dar suporte. Usar ignore faz com que a API remova qualquer parâmetro sem suporte. Use esse valor quando precisar usar a mesma carga útil nos modelos diferentes, mas um dos parâmetros extras pode fazer com que um modelo apresente erro se não for compatível. Usar error faz com que a API rejeite qualquer parâmetro extra no conteúdo. Somente os parâmetros especificados nessa API podem ser indicados, caso contrário, será retornado um erro 400.
azureml-model-deployment string Nome da implantação para a qual você deseja rotear a solicitação. Compatível com pontos de extremidade que dão suporte a várias implantações.

Corpo da solicitação

Nome Obrigatória Type Descrição
input Verdadeiro string[] Texto de entrada para inserir, codificado como uma cadeia de caracteres ou matriz de tokens. Para inserir várias entradas em uma única solicitação, passe uma matriz de cadeias de caracteres ou matriz de matrizes de token.
dimensões Número inteiro O número de dimensões que as inserções de saída resultantes devem ter. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
encoding_format EmbeddingEncodingFormat O formato no qual as inserções devem ser retornadas. Base64, float, int8, uint8, binário ou ubinary. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
input_type EmbeddingInputType O tipo da entrada. text, query ou document. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.

Respostas

Nome Tipo Descrição
200 OK CreateEmbeddingResponse OK
401 Não Autorizado UnauthorizedError O token de acesso está ausente ou é inválido

Cabeçalhos

x-ms-error-code: cadeia de caracteres
404 Não Encontrado NotFoundError Modalidade não compatível com o modelo. Verifique a documentação do modelo para ver quais rotas estão disponíveis.

Cabeçalhos

x-ms-error-code: cadeia de caracteres
422 Entidade Não Processável UnprocessableContentError A solicitação contém conteúdo não processável

Cabeçalhos

x-ms-error-code: cadeia de caracteres
429 Excesso de Solicitações TooManyRequestsError Você atingiu o limite de taxa que lhe foi atribuído e sua solicitação vai precisar aguardar.

Cabeçalhos

x-ms-error-code: cadeia de caracteres
Outros códigos de status ContentFilterError Solicitação incorreta

Cabeçalhos

x-ms-error-code: cadeia de caracteres

Segurança

Autorização

O token com o Bearer: prefix; por exemplo, Bearer abcde12345

Tipo: apiKey In: cabeçalho

Token do AAD

Autenticação OAuth2 do Azure Active Directory

Tipo: oauth2 Fluxo: aplicativo URL do token: https://login.microsoftonline.com/common/oauth2/v2.0/token

Exemplos

Cria um vetor de inserção que representa o texto de entrada

Solicitação de Exemplo

POST /embeddings?api-version=2024-04-01-preview

{
  "input": [
    "This is a very good text"
  ],
  "input_type": "text",
  "encoding_format": "float",
  "dimensions": 1024
}

Resposta de exemplo

Código de status: 200

{
  "data": [
    {
      "index": 0,
      "object": "embedding",
      "embedding": [
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0
      ]
    }
  ],
  "object": "list",
  "model": "BERT",
  "usage": {
    "prompt_tokens": 15,
    "total_tokens": 15
  }
}

Definições

Nome Descrição
ContentFilterError A chamada à API falha quando o prompt dispara um filtro de conteúdo conforme configurado. Modifique o prompt e tente novamente.
CreateEmbeddingRequest Solicitação para criar inserções.
CreateEmbeddingResponse Resposta de uma solicitação de inserções.
Detalhe Detalhes dos erros.
Inserção Representa o objeto de inserção gerado.
EmbeddingEncodingFormat O formato no qual as inserções devem ser retornadas. Base64, float, int8, uint8, binário ou ubinary. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
EmbeddingInputType O tipo da entrada. text, query ou document. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
EmbeddingObject O tipo de objeto, que é sempre de “inserção”.
ListObject O tipo de objeto, que é sempre "lista".
NotFoundError A rota não é válida para o modelo implantado.
TooManyRequestsError Você atingiu o limite de taxa atribuído e suas solicitações precisam ser aceleradas.
UnauthorizedError A autenticação não existe ou é inválida.
UnprocessableContentError A solicitação inclui conteúdo não processável O erro é retornado quando o conteúdo indicado é válido de acordo com essa especificação. No entanto, algumas das instruções indicadas no conteúdo não são compatíveis com o modelo subjacente. Use a seção details para entender o parâmetro ofensivo.
Uso As informações de uso da solicitação.

ContentFilterError

A chamada à API falha quando o prompt dispara um filtro de conteúdo conforme configurado. Modifique o prompt e tente novamente.

Nome Tipo Descrição
code string O código de erro.
error string A descrição do erro.
message string A mensagem de erro.
param string O parâmetro que disparou o filtro de conteúdo.
status Número inteiro O código de status HTTP.

CreateEmbeddingRequest

Solicitação para criar inserções.

Nome Obrigatória Type Descrição
input Verdadeiro string[] Texto de entrada para inserir, codificado como uma cadeia de caracteres ou matriz de tokens. Para inserir várias entradas em uma única solicitação, passe uma matriz de cadeias de caracteres ou matriz de matrizes de token.
dimensões Número inteiro O número de dimensões que as inserções de saída resultantes devem ter. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
encoding_format EmbeddingEncodingFormat O formato no qual as inserções devem ser retornadas. Base64, float, int8, uint8, binário ou ubinary. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.
input_type EmbeddingInputType O tipo da entrada. text, query ou document. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.

CreateEmbeddingResponse

Resposta de uma solicitação de inserções.

Nome Tipo Descrição
data Embedding[] A lista de incorporações geradas pelo modelo.
modelo string O nome do modelo usado para gerar a incorporação.
objeto ListObject O tipo de objeto, que é sempre "lista".
uso Uso As informações de uso da solicitação.

Detalhe

Detalhes do erro UnprocessableContentError.

Nome Tipo Descrição
loc string[] O parâmetro que está causando o problema
value string O valor repassado para o parâmetro que está causando problemas.

Inserção

Representa a inserção gerada.

Nome Tipo Descrição
inserção [] O vetor de inserção. O comprimento do vetor depende do modelo usado e o tipo depende do encoding_format usado.
índice Número inteiro O índice da incorporação na lista de incorporações.
objeto EmbeddingObject O tipo de objeto, que é sempre de “inserção”.

EmbeddingEncodingFormat

O formato no qual as inserções devem ser retornadas. Base64, float, int8, uint8, binário ou ubinary. Isso retornará um erro 422 se o modelo não for compatível com o valor ou parâmetro.

Nome Tipo Descrição
base64 string
binary string
float string
int8 string
ubinary string
uint8 string

EmbeddingInputType

O tipo da entrada. text, query ou document. Retornará um erro 422 se o modelo não der suporte ao valor ou ao parâmetro.

Nome Tipo Descrição
documento string Indica que a entrada representa um documento armazenado em um banco de dados vetorial.
consulta string Indica que a entrada representa uma consulta de pesquisa para localizar os documentos mais relevantes em seu banco de dados vetorial.
text string Indica que a entrada é uma entrada de texto geral.

EmbeddingObject

Nome Tipo Descrição
inserção string

ListObject

O tipo de objeto, que é sempre "lista".

Nome Tipo Description
lista string

NotFoundError

Nome Tipo Descrição
error string A descrição do erro.
message string A mensagem de erro.
status Número inteiro O código de status HTTP.

TooManyRequestsError

Nome Tipo Descrição
error string A descrição do erro.
message string A mensagem de erro.
status Número inteiro O código de status HTTP.

UnauthorizedError

Nome Tipo Descrição
error string A descrição do erro.
message string A mensagem de erro.
status Número inteiro O código de status HTTP.

UnprocessableContentError

A solicitação inclui conteúdo não processável O erro é retornado quando o conteúdo indicado é válido de acordo com essa especificação. No entanto, algumas das instruções indicadas no conteúdo não são compatíveis com o modelo subjacente. Use a seção details para entender o parâmetro ofensivo.

Nome Tipo Descrição
code string O código de erro.
detalhes Detalhe
error string A descrição do erro.
message string A mensagem de erro.
status Número inteiro O código de status HTTP.

Uso

As informações de uso da solicitação.

Nome Tipo Descrição
prompt_tokens Número inteiro O número de tokens usados pelo prompt.
total_tokens Número inteiro O número total de tokens usados pela solicitação.