Saiba como gerar inserções com o OpenAI do Azure

Uma inserção é um formato especial de representação de dados que pode ser facilmente utilizado por algoritmos e modelos de machine learning. A inserção é uma representação densa de informações do significado semântico de um texto. Cada inserção é um vetor de números de ponto flutuante, de modo que a distância entre duas inserções no espaço do vetor esteja correlacionada com a similaridade semântica entre duas entradas no formato original. Por exemplo, se dois textos forem semelhantes, suas representações de vetor também deverão ser semelhantes. As inserções potencializam a busca em vetores de modo semelhante nos bancos de dados do Azure, como Azure Cosmos DB for MongoDB vCore ou Banco de Dados do Azure para PostgreSQL — Servidor Flexível.

Como obter inserções

Para obter um vetor de inserção para um trecho de texto, fazemos uma solicitação ao ponto de extremidade de inserções, conforme mostrado nos seguintes snippets de código:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Práticas recomendadas

Verificar se as entradas não excedem o comprimento máximo

  • O comprimento máximo do texto de entrada para nossos modelos de inserção mais recentes é de 8.192 tokens. Você deve verificar se as entradas não excedem esse limite antes de fazer uma solicitação.
  • Se enviar uma matriz de entradas em uma única solicitação de inserção, o tamanho máximo da matriz será 2048.

Limitações e riscos

Nossos modelos de inserção podem não ser confiáveis ou representar riscos sociais em determinados casos e podem causar danos na ausência de mitigações. Examine nosso conteúdo de IA Responsável para obter mais informações sobre como abordar o uso com responsabilidade.

Próximas etapas