Saiba como gerar incorporações com o Azure OpenAI

Uma incorporação é um formato especial de representação de dados que pode ser facilmente utilizado por modelos e algoritmos de aprendizado de máquina. A incorporação é uma representação densa de informação do significado semântico de um pedaço de texto. Cada incorporação é um vetor de números de ponto flutuante, de tal forma que a distância entre duas incorporações no espaço vetorial está correlacionada com a semelhança semântica entre duas entradas no formato original. Por exemplo, se dois textos são semelhantes, então suas representações vetoriais também devem ser semelhantes. Incorpora a pesquisa de semelhança de vetor de energia em Bancos de Dados do Azure, como o Azure Cosmos DB para MongoDB vCore ou o Banco de Dados do Azure para PostgreSQL - Servidor Flexível.

Como obter incorporações

Para obter um vetor de incorporação para uma parte do texto, fazemos uma solicitação ao ponto de extremidade de incorporações, conforme mostrado nos seguintes trechos de código:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Melhores práticas

Verifique se as entradas não excedem o comprimento máximo

  • O comprimento máximo do texto de entrada para os nossos modelos de incorporação mais recentes é de 8192 tokens. Você deve verificar se suas entradas não excedem esse limite antes de fazer uma solicitação.
  • Se enviar uma matriz de entradas em uma única solicitação de incorporação, o tamanho máximo da matriz é 2048.

Limitações e riscos

Nossos modelos de incorporação podem não ser confiáveis ou representar riscos sociais em certos casos, e podem causar danos na ausência de mitigações. Reveja o nosso conteúdo de IA Responsável para obter mais informações sobre como abordar a sua utilização de forma responsável.

Próximos passos