مشاركة عبر


تعلم كيفية إنشاء التضمينات

التضمين هو تنسيق خاص لتمثيل البيانات يمكن استخدامه بسهولة من قبل نماذج التعلم الآلي والخوارزميات. التضمين هو تمثيل كثيف للمعلومات للمعنى الدلالي لجزء من النص. كل تضمين هو متجه من أرقام النقاط العائمة، بحيث ترتبط المسافة بين تضمينين في مساحة المتجه بالتشابه الدلالي بين إدخالين بالتنسيق الأصلي. على سبيل المثال، إذا كان نصان متشابهين، يجب أن تكون تمثيلات المتجهات متشابهة أيضاً. تضمين البحث عن تشابه متجه الطاقة في قواعد بيانات Azure مثل Azure Cosmos DB ل NoSQL أو Azure Cosmos DB ل MongoDB vCore أو قاعدة بيانات Azure SQL أو قاعدة بيانات Azure ل PostgreSQL - Flexible Server.

المتطلبات

  • تم نشر نموذج تضمين Azure OpenAI.
  • القيم التالية من مصدرك:
    • نقطة النهاية، على سبيل المثال، https://YOUR-RESOURCE-NAME.openai.azure.com/.
    • مفتاح API.
    • اسم نشر الطراز.

لمزيد من الإرشادات حول الإعداد الخاص باللغات، راجع لغات البرمجة المدعومة من Azure OpenAI.

كيفية الحصول على التضمينات

للحصول على متجه تضمين لنص ما، قم بتقديم طلب إلى نقطة نهاية التضمين كما هو موضح في مقتطفات الكود التالية:

إشعار

واجهة برمجة تطبيقات التضمين في Azure OpenAI لا تدعم حاليا Microsoft Entra ID مع واجهة الإصدار 1. استخدم مصادقة مفاتيح API للأمثلة في هذا المقال.

using OpenAI;
using OpenAI.Embeddings;
using System.ClientModel;

EmbeddingClient client = new(
    "text-embedding-3-small",
    credential: new ApiKeyCredential("API-KEY"),
    options: new OpenAIClientOptions()
    {

        Endpoint = new Uri("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1")
    }
);

string input = "This is a test";

OpenAIEmbedding embedding = client.GenerateEmbedding(input);
ReadOnlyMemory<float> vector = embedding.ToFloats();
Console.WriteLine($"Embeddings: [{string.Join(", ", vector.ToArray())}]");

أفضل الممارسات

التحقق من أن المدخلات لا تتجاوز الحد الأقصى للطول

  • الحد الأقصى لطول نص الإدخال لأحدث نماذج التضمين لدينا هو 8192 رمزا مميزا. يجب التحقق من أن مدخلاتك لا تتجاوز هذا الحد قبل تقديم طلب.
  • إذا كان إرسال صفيف من المدخلات في طلب تضمين واحد هو الحد الأقصى لحجم الصفيف هو 2048.
  • عند إرسال صفيف من المدخلات في طلب واحد، تذكر أن عدد الرموز المميزة في الدقيقة في طلباتك يجب أن يظل أقل من حد الحصة النسبية الذي تم تعيينه في نشر النموذج. بشكل افتراضي، تخضع أحدث نماذج التضمين من الجيل 3 إلى حد 350 K TPM لكل منطقة.

استكشاف الأخطاء وإصلاحها

  • إذا ظهرت 401 لك خطأ OR 403 ، تأكد من أن مفتاح API صالح للمورد.
  • إذا ظهرت 404 خطأ، تأكد من أن نقطة النهاية تتضمن المسار /openai/v1/ وأنك استخدمت الرابط الأساسي الصحيح.
  • إذا ظهرت 400 خطأ، تم تعيين التأكيد model على اسم النشر الخاص بك وجسم الطلب هو JSON صالح.

القيود والمخاطر

قد تكون نماذج التضمين الخاصة بنا غير موثوق بها أو تشكل مخاطر اجتماعية في حالات معينة، وقد تسبب ضررا في غياب عوامل التخفيف من المخاطر. راجع محتوى الذكاء الاصطناعي المسؤول للحصول على مزيد من المعلومات حول كيفية التعامل مع استخدامها بمسؤولية.

الخطوات التالية