Bagikan melalui


Pelajari cara membuat penyematan dengan Azure OpenAI

Penyematan adalah format khusus representasi data yang dapat dengan mudah digunakan oleh model dan algoritma pembelajaran mesin. Penyematan adalah representasi padat informasi dari arti semantik dari sepotong teks. Setiap penyematan adalah vektor angka titik yang mengambang, sehingga jarak antara dua penyematan di ruang vektor berkorelasi dengan kesamaan semantik antara dua input dalam format asli. Misalnya, jika ada dua teks serupa, maka representasi vektornya juga harus serupa. Menyematkan pencarian kesamaan vektor daya di Azure Databases seperti Azure Cosmos DB untuk MongoDB vCore , Azure SQL Database atau Azure Database for PostgreSQL - Server Fleksibel.

Cara mendapatkan penyematan

Untuk mendapatkan vektor penyematan untuk sepotong teks, kita membuat permintaan ke titik akhir penyematan seperti yang ditunjukkan dalam cuplikan kode berikut:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Praktik terbaik

Verifikasi input jangan melebihi panjang maksimum

  • Panjang maksimum teks input untuk model penyematan terbaru kami adalah token 8192. Anda harus memverifikasi bahwa input Anda tidak melebihi batas ini sebelum membuat permintaan.
  • Jika mengirim array input dalam satu permintaan penyematan, ukuran array maks adalah 2048.

Batasan & risiko

Model penyematan kami mungkin tidak dapat diandalkan atau menimbulkan risiko sosial dalam kasus tertentu, dan dapat membahayakan tanpa adanya mitigasi. Harap tinjau konten AI yang Bertanggung Jawab kami untuk mengetahui informasi selengkapnya tentang cara mendekati penggunanya secara bertanggung jawab.

Langkah berikutnya