معالجة البيانات مسبقا للتعلم الآلي والتعلم العميق

يمكنك استخدام Databricks Feature Store لإنشاء ميزات جديدة واستكشاف الميزات الموجودة وإعادة استخدامها، وتحديد ميزات لتدريب نماذج التعلم الآلي وتسجيلها، ونشر الميزات إلى المتاجر عبر الإنترنت ذات زمن الانتقال المنخفض للاستدلال في الوقت الحقيقي.

في مجموعات البيانات الكبيرة، يمكنك استخدام Spark SQL وMLlib لهندسة الميزات. توفر مكتبات الجهات الخارجية المضمنة في التعلم الآلي من Databricks Runtime مثل scikit-learn أيضا أساليب مساعدة مفيدة. للحصول على أمثلة، راجع دفاتر ملاحظات التعلم الآلي التالية ل scikit-learn وMLlib:

لمعالجة ميزة التعلم العميق الأكثر تعقيدا، يوضح دفتر الملاحظات المثال هذا كيفية استخدام نقل التعلم للتميز: