Pelajari cara membuat penyematan dengan Azure OpenAI
Penyematan adalah format khusus representasi data yang dapat dengan mudah digunakan oleh model dan algoritma pembelajaran mesin. Penyematan adalah representasi padat informasi dari arti semantik dari sepotong teks. Setiap penyematan adalah vektor angka titik yang mengambang, sehingga jarak antara dua penyematan di ruang vektor berkorelasi dengan kesamaan semantik antara dua input dalam format asli. Misalnya, jika ada dua teks serupa, maka representasi vektornya juga harus serupa. Menyematkan pencarian kesamaan vektor daya di Azure Databases seperti Azure Cosmos DB untuk MongoDB vCore , Azure SQL Database atau Azure Database for PostgreSQL - Server Fleksibel.
Cara mendapatkan penyematan
Untuk mendapatkan vektor penyematan untuk sepotong teks, kita membuat permintaan ke titik akhir penyematan seperti yang ditunjukkan dalam cuplikan kode berikut:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Praktik terbaik
Verifikasi input jangan melebihi panjang maksimum
- Panjang maksimum teks input untuk model penyematan terbaru kami adalah 8.192 token. Anda harus memverifikasi bahwa input Anda tidak melebihi batas ini sebelum membuat permintaan.
- Jika mengirim array input dalam satu permintaan penyematan, ukuran array maks adalah 2048.
- Saat mengirim array input dalam satu permintaan, ingatlah bahwa jumlah token per menit dalam permintaan Anda harus tetap di bawah batas kuota yang ditetapkan pada penyebaran model. Secara default, model penyematan generasi 3 terbaru tunduk pada batas 350 K TPM per wilayah.
Batasan & risiko
Model penyematan kami mungkin tidak dapat diandalkan atau menimbulkan risiko sosial dalam kasus tertentu, dan dapat membahayakan tanpa adanya mitigasi. Harap tinjau konten AI yang Bertanggung Jawab kami untuk mengetahui informasi selengkapnya tentang cara mendekati penggunanya secara bertanggung jawab.
Langkah berikutnya
- Pelajari selengkapnya tentang menggunakan Azure OpenAI dan penyematan untuk melakukan pencarian dokumen dengan tutorial penyematan kami.
- Pelajari selengkapnya tentang model yang mendasari yang mendukung Azure OpenAI.
- Simpan penyematan Anda dan lakukan pencarian vektor (kesamaan) menggunakan pilihan layanan Anda: