جمع البيانات من النماذج في الإنتاج

ينطبق على:ملحق ML Azure CLI v2 (الحالي)Python SDK azure-ai-ml v2 (الحالي)

في هذه المقالة، يمكنك التعرف على جمع البيانات من النماذج التي يتم نشرها إلى Azure التعلم الآلي نقاط النهاية عبر الإنترنت.

يوفر Azure التعلم الآلي Data collector تسجيل بيانات الإدخال والإخراج في الوقت الفعلي من النماذج التي يتم نشرها إلى نقاط النهاية المدارة عبر الإنترنت أو نقاط نهاية Kubernetes عبر الإنترنت. يخزن Azure التعلم الآلي بيانات الاستدلال المسجلة في تخزين Azure blob. يمكن بعد ذلك استخدام هذه البيانات بسلاسة لمراقبة النموذج أو تصحيح الأخطاء أو التدقيق، وبالتالي توفير إمكانية المراقبة في أداء النماذج المنشورة.

يوفر مجمع البيانات:

  • تسجيل بيانات الاستدلال إلى موقع مركزي (Azure Blob Storage)
  • دعم نقاط النهاية المدارة عبر الإنترنت ونقاط نهاية Kubernetes عبر الإنترنت
  • التعريف على مستوى النشر، ما يسمح بإجراء الحد الأقصى من التغييرات على تكوينه
  • دعم كل من الحمولة والتسجيل المخصص

أوضاع التسجيل

يوفر مجمع البيانات وضعين للتسجيل: تسجيل الحمولة والتسجيل المخصص. يسمح لك تسجيل الحمولة بجمع بيانات حمولة طلب HTTP والاستجابة من النماذج المنشورة. مع التسجيل المخصص، يوفر لك Azure التعلم الآلي Python SDK لتسجيل Pandas DataFrames مباشرة من البرنامج النصي لتسجيل النقاط. باستخدام تسجيل Python SDK المخصص، يمكنك تسجيل بيانات إدخال وإخراج النموذج، بالإضافة إلى البيانات قبل وأثناء وبعد أي تحويلات بيانات (أو معالجة مسبقة).

تكوين مجمع البيانات

يمكن تكوين جامع البيانات على مستوى النشر، ويتم تحديد التكوين في وقت النشر. يمكنك تكوين وجهة تخزين Azure Blob التي ستتلقى البيانات المجمعة. يمكنك أيضا تكوين معدل أخذ العينات (يتراوح من 0 إلى 100٪ من البيانات لجمعها.

القيود

يحتوي مجمع البيانات على القيود التالية:

  • يدعم مجمع البيانات فقط تسجيل نقاط نهاية Azure التعلم الآلي عبر الإنترنت (أو في الوقت الحقيقي) (مدار أو Kubernetes).
  • يدعم جامع البيانات Python SDK فقط تسجيل البيانات الجدولية عبر Pandas DataFrames.