التعلم العميق

تقدم هذه المقالة مقدمة موجزة حول استخدام PyTorch وTensorflow والتدريب الموزع لتطوير نماذج التعلم العميق وضبطها على Azure Databricks. كما يتضمن ارتباطات إلى صفحات تتضمن أمثلة على دفاتر ملاحظات توضح كيفية استخدام هذه الأدوات.

PyTorch

يتم تضمين PyTorch في التعلم الآلي من Databricks Runtime ويوفر حساب موتر مسرع لوحدة معالجة الرسومات ووظائف عالية المستوى لبناء شبكات التعلم العميق. يمكنك إجراء تدريب عقدة واحدة أو تدريب موزع باستخدام PyTorch على Databricks. راجع PyTorch.

TensorFlow

يتضمن التعلم الآلي من Databricks Runtime TensorFlow وTensorBoard، بحيث يمكنك استخدام هذه المكتبات دون تثبيت أي حزم. يدعم TensorFlow التعلم العميق والحسابات الرقمية العامة على وحدات المعالجة المركزية ووحدات معالجة الرسومات ومجموعات وحدات معالجة الرسومات. يوفر TensorBoard أدوات تصور لمساعدتك على تصحيح أخطاء التعلم الآلي وسير عمل التعلم العميق وتحسينها. راجع TensorFlow للحصول على عقدة واحدة وأمثلة التدريب الموزعة.

التدريب الموزع

نظرا لأن نماذج التعلم العميق هي بيانات وتدريب حسابي مكثف، يمكن أن يكون التدريب الموزع مهما. للحصول على أمثلة للتعلم العميق الموزع باستخدام عمليات التكامل مع Horovod وS spark-tensorflow-distributortorchDistributor و DeepSpeed، راجع التدريب الموزع.

تتبع تطوير نموذج التعلم العميق

لا يزال التتبع حجر الزاوية في النظام البيئي ل MLflow وهو أمر حيوي بشكل خاص للطبيعة التكرارية للتعلم العميق. يستخدم Databricks MLflow لتتبع عمليات تشغيل التدريب على التعلم العميق وتطوير النماذج. راجع تعقب تطوير النموذج باستخدام MLflow.