واجهات برمجة تطبيقات نموذج Databricks Foundation

توفر هذه المقالة نظرة عامة على واجهات برمجة تطبيقات نموذج الأساس في Azure Databricks. وهو يتضمن متطلبات الاستخدام والنماذج المدعومة والقيود.

ما هي واجهات برمجة تطبيقات نموذج Databricks Foundation؟

يدعم Databricks Model Serving الآن واجهات برمجة تطبيقات نموذج الأساس التي تسمح لك بالوصول إلى أحدث النماذج المفتوحة والاستعلام عنها من نقطة نهاية الخدمة. باستخدام واجهات برمجة التطبيقات لنموذج الأساس، يمكنك إنشاء تطبيقات بسرعة وسهولة تستفيد من نموذج الذكاء الاصطناعي توليدي عالي الجودة دون الحفاظ على نشر النموذج الخاص بك.

يتم توفير واجهات برمجة التطبيقات لنموذج الأساس في وضعين للتسعير:

  • الدفع لكل رمز مميز: هذه هي أسهل طريقة لبدء الوصول إلى نماذج الأساس على Databricks ويوصى بها لبدء رحلتك باستخدام واجهات برمجة تطبيقات نموذج المؤسسة. لم يتم تصميم هذا الوضع للتطبيقات عالية الإنتاجية أو أحمال عمل الإنتاج عالية الأداء.
  • معدل النقل المقدم: يوصى بهذا الوضع لجميع أحمال عمل الإنتاج، خاصة تلك التي تتطلب إنتاجية عالية، أو ضمانات أداء، أو نماذج دقيقة، أو لديها متطلبات أمان إضافية. تتوفر نقاط نهاية معدل النقل المتوفرة مع شهادات التوافق مثل HIPAA.

راجع استخدام واجهات برمجة تطبيقات نموذج الأساس للحصول على إرشادات حول كيفية استخدام هذين الوضعين والنماذج المدعومة.

باستخدام واجهات برمجة التطبيقات لنموذج الأساس، يمكنك:

  • الاستعلام عن LLM معمم للتحقق من صحة المشروع قبل استثمار المزيد من الموارد.
  • الاستعلام عن LLM معمم من أجل إنشاء إثبات سريع للمفهوم لتطبيق قائم على LLM قبل الاستثمار في التدريب ونشر نموذج مخصص.
  • استخدم نموذج أساس، جنبا إلى جنب مع قاعدة بيانات متجهة، لإنشاء روبوت دردشة باستخدام الجيل المعزز المسترد (RAG).
  • استبدل النماذج الخاصة ببدائل مفتوحة لتحسين التكلفة والأداء.
  • قم بمقارنة LLMs بكفاءة لمعرفة أفضل مرشح لحالة الاستخدام الخاصة بك، أو مبادلة نموذج إنتاج بنموذج أداء أفضل.
  • إنشاء تطبيق LLM للتطوير أو الإنتاج على رأس حل خدمة LLM قابل للتطوير ومساندة من اتفاقية مستوى الخدمة الذي يمكن أن يدعم ارتفاعات حركة مرور الإنتاج.

الاحتياجات

  • رمز واجهة برمجة تطبيقات Databricks لمصادقة طلبات نقطة النهاية.
  • حساب بلا خادم (لنماذج معدل النقل المقدمة).
  • مساحة عمل في منطقة مدعومة:

إشعار

للحصول على أحمال عمل معدل النقل المتوفرة التي تستخدم نموذج قاعدة DBRX، راجع حدود واجهات برمجة التطبيقات لنموذج الأساس لتوفر المنطقة.

استخدام واجهات برمجة التطبيقات لنموذج الأساس

لديك خيارات متعددة لاستخدام واجهات برمجة تطبيقات نموذج الأساس.

تتوافق واجهات برمجة التطبيقات مع OpenAI، حتى أنه يمكنك استخدام عميل OpenAI للاستعلام. يمكنك أيضا استخدام واجهة المستخدم أو واجهات برمجة تطبيقات نماذج الأساس Python SDK أو MLflow Deployments SDK أو REST API للاستعلام عن النماذج المدعومة. توصي Databricks باستخدام MLflow Deployments SDK أو REST API للتفاعلات الموسعة وواجهة المستخدم لتجربة الميزة.

راجع نماذج أساسيات الاستعلام للحصول على أمثلة تسجيل النقاط.

واجهات برمجة تطبيقات نموذج أساس الدفع لكل رمز مميز

هام

هذه الميزة في المعاينة العامة.

يمكن الوصول إلى نماذج الدفع لكل رمز مميز في مساحة عمل Azure Databricks، ويوصى بها للبدء. للوصول إليها في مساحة العمل الخاصة بك، انتقل إلى علامة التبويب تقديم في الشريط الجانبي الأيسر. توجد واجهات برمجة تطبيقات نموذج الأساس في أعلى طريقة عرض قائمة نقاط النهاية.

تقديم قائمة نقاط النهاية

يلخص الجدول التالي النماذج المدعومة للدفع لكل رمز مميز. راجع النماذج المدعومة للدفع لكل رمز مميز للحصول على معلومات نموذج إضافية.

إذا كنت ترغب في اختبار هذه النماذج والدردشة معها، يمكنك القيام بذلك باستخدام الذكاء الاصطناعي Playground. راجع الدردشة مع LLMs المدعومة باستخدام الذكاء الاصطناعي Playground.

النموذج نوع المهمة نقطة النهاية
تعليمات DBRX محادثة databricks-dbrx-instruct
Meta-Llama-3-70B-Instruct محادثة databricks-meta-llama-3-70b-instruct
Meta-Llama-2-70B-Chat محادثة databricks-llama-2-70b-chat
تعليمات Mixtral-8x7B محادثة databricks-mixtral-8x7b-instruct
تعليمات MPT 7B الاكتمال databricks-mpt-7b-instruct
تعليمات MPT 30B الاكتمال databricks-mpt-30b-instruct
BGE Large (English) عمليات التضمين databricks-bge-large-en

واجهات برمجة تطبيقات نموذج مؤسسة معدل النقل المتوفرة

يتوفر معدل النقل المتوفر بشكل عام وتوصي Databricks بسعة النقل المتوفرة لأحمال عمل الإنتاج. يوفر معدل النقل المقدم نقاط نهاية مع استدلال محسن لأحمال عمل نموذج الأساس التي تتطلب ضمانات الأداء. راجع واجهات برمجة تطبيقات نموذج أساس معدل النقل المتوفرة للحصول على دليل خطوة بخطوة حول كيفية نشر واجهات برمجة تطبيقات نموذج المؤسسة في الوضع المتوفر في جميع أنحاء.

يتضمن دعم معدل النقل المقدم ما يلي:

  • نماذج أساسية من جميع الأحجام، مثل قاعدة DBRX. يمكن الوصول إلى النماذج الأساسية باستخدام Databricks Marketplace، أو يمكنك بدلا من ذلك تنزيلها من Hugging Face أو مصدر خارجي آخر وتسجيلها في كتالوج Unity. ويعمل النهج الأخير مع أي متغير دقيق من النماذج المدعومة، بغض النظر عن أسلوب الضبط الدقيق المستخدم.
  • متغيرات دقيقة من النماذج الأساسية، مثل LlamaGuard-7B. وهذا يشمل النماذج التي يتم ضبطها بدقة على البيانات الخاصة.
  • الأوزان المخصصة بالكامل والرموز المميزة، مثل تلك التي تم تدريبها من البداية أو استمرار التدريب المسبق أو الاختلافات الأخرى باستخدام بنية النموذج الأساسي (مثل CodeLlama أو Yi-34B-Chat أو SOLAR-10.7B).

يلخص الجدول التالي بنيات النموذج المدعومة لمعدل النقل المقدم.

تصميم نموذجي أنواع المهام ملاحظات
DBRX الدردشة أو الإكمال راجع حدود واجهات برمجة التطبيقات لنموذج الأساس لتوفر المنطقة.
Meta Llama 3 الدردشة أو الإكمال
Meta Llama 2 الدردشة أو الإكمال
ميسترال الدردشة أو الإكمال
مختلط الدردشة أو الإكمال
Mpt الدردشة أو الإكمال
BGE v1.5 (الإنجليزية) عمليات التضمين

القيود

راجع حدود ومناطق خدمة النموذج.

الموارد الإضافية