يوليو 2019

تم إصدار هذه الميزات وتحسينات النظام الأساسي ل Azure Databricks في يوليو 2019.

إشعار

يتم تنظيم الإصدارات. قد لا يتم تحديث حساب Azure Databricks الخاص بك حتى أسبوع بعد تاريخ الإصدار الأولي.

قريبا: Databricks 6.0 لن يدعم Python 2

توقعا لانتهاء العمر الافتراضي القادم ل Python 2، الذي تم الإعلان عنه في عام 2020، لن يتم دعم Python 2 في Databricks Runtime 6.0. ستستمر الإصدارات السابقة من Databricks Runtime في دعم Python 2. نتوقع إصدار Databricks Runtime 6.0 لاحقا في 2019.

تحميل إصدار وقت تشغيل Databricks مسبقا على مثيلات تعطل التجمع

30 يوليو - 6 أغسطس 2019: الإصدار 2.103

يمكنك الآن تسريع عمليات تشغيل نظام المجموعة المدعومة بالتجمع عن طريق تحديد إصدار Databricks Runtime ليتم تحميله على مثيلات الخاملة في التجمع. يسمى الحقل في واجهة مستخدم التجمع إصدار Spark الذي تم تحميله مسبقا.

Preloaded Spark version

تشغيل علامات نظام المجموعة المخصصة وعلامات التجمع بشكل أفضل معا

30 يوليو - 6 أغسطس 2019: الإصدار 2.103

في وقت سابق من هذا الشهر، قدمت Azure Databricks تجمعات، وهي مجموعة من المثيلات الخاملة التي تساعدك على تدوير المجموعات بسرعة. في الإصدار الأصلي، ورثت المجموعات المدعومة بالتجمع العلامات الافتراضية والمخصصة من تكوين التجمع، ولا يمكنك تعديل هذه العلامات على مستوى نظام المجموعة. الآن يمكنك تكوين علامات مخصصة خاصة بمجموعة مدعومة من التجمع، وستطبق هذه المجموعة جميع العلامات المخصصة، سواء موروثة من التجمع أو معينة إلى تلك المجموعة على وجه التحديد. لا يمكنك إضافة علامة مخصصة خاصة بالمجموعة بنفس اسم المفتاح كعلامة مخصصة موروثة من تجمع (أي، لا يمكنك تجاوز علامة مخصصة موروثة من التجمع). للحصول على التفاصيل، راجع علامات التجمع.

يوفر MLflow 1.1 العديد من تحسينات واجهة المستخدم وواجهة برمجة التطبيقات

30 يوليو - 6 أغسطس 2019: الإصدار 2.103

يقدم MLflow 1.1 العديد من الميزات الجديدة لتحسين واجهة المستخدم وقابلية استخدام واجهة برمجة التطبيقات:

  • تتيح لك واجهة مستخدم نظرة عامة على عمليات التشغيل الآن استعراض صفحات متعددة من عمليات التشغيل إذا تجاوز عدد عمليات التشغيل 100. بعد التشغيل 100، انقر فوق الزر تحميل المزيد لتحميل عمليات التشغيل ال 100 التالية.

    Paged runs

  • توفر واجهة مستخدم تشغيل المقارنة الآن مخطط إحداثيات متوازي. يسمح لك الرسم بمراقبة العلاقات بين مجموعة n-الأبعاد من المعلمات والمقاييس. يقوم بتصور كافة عمليات التشغيل كخطوط مرمزة بالألوان استنادا إلى قيمة المقياس (على سبيل المثال، الدقة)، ويعرض قيم المعلمات التي استغرقها كل تشغيل.

    Parallel coordinates plot

  • يمكنك الآن إضافة العلامات وتحريرها من واجهة مستخدم نظرة عامة على التشغيل وعرض العلامات في طريقة عرض بحث التجربة.

  • تتيح لك واجهة برمجة تطبيقات MLflowContext الجديدة إنشاء وتسجيل التشغيل بطريقة مشابهة لواجهة برمجة تطبيقات Python. تتباين واجهة برمجة التطبيقات هذه مع واجهة برمجة التطبيقات الحالية ذات المستوى MlflowClient المنخفض، والتي تقوم ببساطة بتضمين واجهات برمجة تطبيقات REST.

  • يمكنك الآن حذف العلامات من تشغيل MLflow باستخدام واجهة برمجة تطبيقات DeleteTag.

للحصول على التفاصيل، راجع منشور مدونة MLflow 1.1. للحصول على قائمة كاملة بالميزات والإصلاحات، راجع سجل تغيير MLflow.

عرض pandas DataFrame يعرض كما يفعل في Jupyter

30 يوليو - 6 أغسطس 2019: الإصدار 2.103

الآن عند استدعاء Pandas DataFrame، فإنه سيعرض بنفس الطريقة كما هو الحال في Jupyter.

Display pandas DataFrame

مناطق جديدة

30 يوليو 2019

يتوفر Azure Databricks الآن في المناطق الإضافية التالية:

  • وسط كوريا
  • جنوب أفريقيا

Databricks Runtime 5.5 مع Conda (Beta)

23 يوليو 2019

هام

وقت تشغيل Databricks مع Conda في Beta. قد تتغير محتويات البيئات المدعومة في إصدارات بيتا القادمة. يمكن أن تتضمن التغييرات قائمة الحزم أو إصدارات الحزم المثبتة. تم إنشاء Databricks Runtime 5.5 مع Conda أعلى Databricks Runtime 5.5 LTS (غير مدعوم).

يضيف Databricks Runtime 5.5 مع إصدار Conda واجهة برمجة تطبيقات مكتبة جديدة ذات نطاق دفتر ملاحظات لدعم تحديث بيئة Conda لدفتر الملاحظات باستخدام مواصفات YAML (راجع وثائق Conda).

راجع ملاحظات الإصدار الكاملة في Databricks Runtime 5.5 مع Conda (غير مدعوم).

حد اتصال metastore المحدث

16 يوليو - 23 يوليو 2019: الإصدار 2.102

سيكون لمساحات عمل Azure Databricks الجديدة في eastus، eastus2، centralus، westus، westus2، westeurope، northeurope حد اتصال metastore أعلى يبلغ 250. ستستمر مساحات العمل الحالية في استخدام metastore الحالي دون أي تعطيل وتستمر في حد الاتصال 100.

تعيين الأذونات على التجمعات (معاينة عامة)

16 يوليو - 23 يوليو 2019: الإصدار 2.102

تدعم واجهة مستخدم التجمع الآن تعيين الأذونات على من يمكنه إدارة التجمعات ومن يمكنه إرفاق المجموعات بالتجمعات.

للحصول على التفاصيل، راجع أذونات التجمع.

Databricks Runtime 5.5 for التعلم الآلي

15 يوليو 2019

تم إنشاء Databricks Runtime 5.5 ML أعلى Databricks Runtime 5.5 LTS (غير مدعوم). يحتوي على العديد من مكتبات التعلم الآلي الشائعة، بما في ذلك TensorFlow وPyTorch وKeras وXGBoost، ويوفر تدريب TensorFlow الموزع باستخدام Horovod.

يتضمن هذا الإصدار الميزات والتحسينات الجديدة التالية:

  • تمت إضافة حزمة MLflow 1.0 Python
  • مكتبات التعلم الآلي التي تمت ترقيتها
    • تمت ترقية TensorFlow من 1.12.0 إلى 1.13.1
    • تمت ترقية PyTorch من 0.4.1 إلى 1.1.0
    • تمت ترقية scikit-learn من 0.19.1 إلى 0.20.3
  • عملية عقدة واحدة ل HorovodRunner

للحصول على التفاصيل، راجع Databricks Runtime 5.5 LTS ل ML (غير مدعوم).

Databricks Runtime 5.5

15 يوليو 2019

Databricks Runtime 5.5 متوفر الآن. يتضمن Databricks Runtime 5.5 Apache Spark 2.4.3 ومكتبات Python وR وJava وSc scala التي تمت ترقيتها والميزات الجديدة التالية:

  • Delta Lake على Azure Databricks Auto Optimize GA
  • تحسين Delta Lake على Azure Databricks الحد الأدنى والحد الأقصى وعدد أداء استعلام التجميع
  • مسارات استدلال نموذج أسرع مع مصدر بيانات ملف ثنائي محسن ومكرر عددي Pandas UDF (معاينة عامة)
  • واجهة برمجة تطبيقات الأسرار في دفاتر ملاحظات R

للحصول على التفاصيل، راجع Databricks Runtime 5.5 LTS (غير مدعوم).

الاحتفاظ بمجموعة من المثيلات في وضع الاستعداد لإطلاق نظام المجموعة السريع (معاينة عامة)

9 يوليو - 11 يوليو 2019: الإصدار 2.101

لتقليل وقت بدء نظام المجموعة، يدعم Azure Databricks الآن إرفاق مجموعة بمجموعة محددة مسبقا من المثيلات الخاملة. عند إرفاقها بتجمع، يخصص نظام المجموعة عقد برنامج التشغيل والعامل الخاصة به من التجمع. إذا لم يكن لدى التجمع موارد الخامة كافية لاستيعاب طلب نظام المجموعة، يتوسع التجمع عن طريق تخصيص مثيلات جديدة من موفر السحابة. عند إنهاء مجموعة مرفقة، يتم إرجاع المثيلات التي استخدمتها إلى التجمع ويمكن إعادة استخدامها بواسطة نظام مجموعة مختلف.

لا تفرض Azure Databricks رسوما على وحدات DBUs بينما تكون المثيلات الخامة في التجمع. يتم تطبيق فوترة موفر المثيل. راجع التسعير.

للحصول على التفاصيل، راجع مرجع تكوين التجمع.

مقاييس Ganglia

9 يوليو - 11 يوليو 2019: الإصدار 2.101

Ganglia هو نظام مراقبة موزع قابل للتطوير متاح الآن على مجموعات Azure Databricks. تساعدك مقاييس Ganglia على مراقبة أداء المجموعة وصحتها. يمكنك الوصول إلى مقاييس Ganglia من صفحة تفاصيل المجموعة:

Ganglia Metrics tab

للحصول على تفاصيل حول استخدام المقاييس وتكوينها، راجع مقاييس Ganglia.

لون السلسلة العمومية

9 يوليو - 11 يوليو 2019: الإصدار 2.101

يمكنك الآن تحديد أن ألوان السلسلة يجب أن تكون متناسقة عبر جميع المخططات في دفتر الملاحظات. راجع تناسق الألوان عبر المخططات.

Global series color