مشاركة عبر


ملاحظات الإصدار لهندسة ميزات Databricks ومخزن ميزات مساحة العمل القديم

تسرد هذه الصفحة إصدارات Databricks Feature Engineering في عميل كتالوج Unity وعميل Databricks Workspace Feature Store. كلا العميلين متاحان على PyPI كهندسة ميزة databricks.

تستخدم المكتبات في:

  • إنشاء جداول الميزات وقراءتها وكتابتها.
  • تدريب النماذج على بيانات الميزات.
  • نشر جداول الميزات إلى المتاجر عبر الإنترنت لتقديمها في الوقت الحقيقي.

للحصول على وثائق الاستخدام، راجع مخزن ميزات Databricks. للحصول على وثائق واجهة برمجة تطبيقات Python، راجع واجهة برمجة تطبيقات Python.

يعمل عميل هندسة الميزات في كتالوج Unity للميزات وجداول الميزات في كتالوج Unity. يعمل عميل Workspace Feature Store مع الميزات وجداول الميزات في Workspace Feature Store. يتم تثبيت كلا العميلين مسبقا في Databricks Runtime التعلم الآلي. كما يمكن تشغيلها على Databricks Runtime بعد التثبيت databricks-feature-engineering من PyPI (pip install databricks-feature-engineering). لاختبار الوحدة فقط، يمكن استخدام كلا العميلين محليا أو في بيئات CI/CD.

للحصول على جدول يعرض توافق إصدار العميل مع Databricks Runtime وإصدارات Databricks Runtime ML، راجع مصفوفة توافق هندسة الميزات. تتوفر الإصدارات القديمة من عميل Databricks Workspace Feature Store على PyPI كمخزن databricks-feature-store.

databricks-feature-engineering 0.7.0

  • يمكن الآن استخدام طرق عرض معينة في كتالوج Unity كجداول ميزات لتدريب النموذج وتقييمه دون اتصال. راجع القراءة من جدول ميزات في كتالوج Unity.
  • يمكن الآن إنشاء مجموعات التدريب مع عمليات البحث عن الميزات أو مواصفات الميزة. راجع مرجع Python SDK.

databricks-feature-engineering 0.6.0

  • يتم الآن دعم تشغيل الصلات في نقطة زمنية مع Spark الأصلي، بالإضافة إلى الدعم الحالي مع Tempo. شكرا جزيلا لسيميون سنشينكو لاقتراحه الفكرة!
  • StructType معتمد الآن كنوع بيانات PySpark. StructType غير مدعوم لخدمة عبر الإنترنت.
  • write_tableيدعم الآن الكتابة إلى الجداول التي تم تمكين تكوين أنظمة المجموعات السائلة فيها.
  • timeseries_columns تمت إعادة تسمية المعلمة ل create_table إلى timeseries_column. يمكن أن تستمر مهام سير العمل الحالية في استخدام المعلمة timeseries_columns .
  • score_batch يدعم الآن المعلمة env_manager . راجع وثائق MLflow لمزيد من المعلومات.

databricks-feature-engineering 0.5.0

  • واجهة برمجة تطبيقات update_feature_spec جديدة في databricks-feature-engineering تسمح للمستخدمين بتحديث مالك FeatureSpec في كتالوج Unity.

databricks-feature-engineering 0.4.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-engineering 0.3.0

  • log_modelالآن يستخدم حزمة databricks-feature-lookup PyPI الجديدة، والتي تتضمن تحسينات الأداء لخدمة النموذج عبر الإنترنت.

databricks-feature-store 0.17.0

  • databricks-feature-store مهمل. تتوفر جميع الوحدات النمطية الموجودة في هذه الحزمة في databricks-feature-engineering الإصدار 0.2.0 وما فوق. للحصول على التفاصيل، راجع واجهة برمجة تطبيقات Python.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering يحتوي الآن على جميع الوحدات النمطية من databricks-feature-store. للحصول على التفاصيل، راجع واجهة برمجة تطبيقات Python.

databricks-feature-store 0.16.3

  • إصلاح خطأ المهلة عند استخدام AutoML مع جداول الميزات.

databricks-feature-engineering 0.1.3

  • تحسينات صغيرة في UpgradeClient.

databricks-feature-store 0.16.2

databricks-feature-store 0.16.1

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-engineering 0.1.2 وdatabricks-feature-store 0.16.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.
    • تم إصلاح عناوين URL الخاصة دورة حياة المهام غير الصحيحة التي تم تسجيلها مع إعدادات معينة لمساحة العمل.

databricks-feature-engineering 0.1.1

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-engineering 0.1.0

  • إصدار GA لهندسة الميزات في عميل Python كتالوج Unity إلى PyPI

databricks-feature-store 0.15.1

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.15.0

  • يمكنك الآن استنتاج مثال إدخال وتسجيله تلقائيا عند تسجيل نموذج. للقيام بذلك، قم بتعيين infer_model_example إلى True عند استدعاء log_model. يستند المثال إلى بيانات التدريب المحددة في المعلمة training_set .

databricks-feature-store 0.14.2

  • إصلاح الخطأ في النشر إلى Aurora MySQL من MariaDB Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.14.0

بدءا من 0.14.0، يجب تحديد أعمدة مفتاح الطابع الزمني في الوسيطة primary_keys . مفاتيح الطابع الزمني هي جزء من "المفاتيح الأساسية" التي تحدد كل صف بشكل فريد في جدول الميزات. مثل أعمدة المفاتيح الأساسية الأخرى، لا يمكن أن تحتوي أعمدة مفاتيح الطابع الزمني على قيم NULL.

في المثال التالي، يحتوي DataFrame user_features_df على الأعمدة التالية: user_idو tspurchases_30dو و.is_free_trial_active

0.14.0 وما فوق

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 وما دونه

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.13.0

  • الحد الأدنى المطلوب mlflow-skinny للإصدار هو الآن 2.4.0.
  • فشل إنشاء مجموعة تدريب إذا كان DataFrame المتوفر لا يحتوي على جميع مفاتيح البحث المطلوبة.
  • عند تسجيل نموذج يستخدم جداول الميزات في كتالوج Unity، يتم تسجيل توقيع MLflow تلقائيا مع النموذج.

databricks-feature-store 0.12.0

  • يمكنك الآن حذف متجر عبر الإنترنت باستخدام drop_online_table واجهة برمجة التطبيقات.

databricks-feature-store 0.11.0

  • في مساحات العمل الممكنة لكتالوج Unity، يمكنك الآن نشر كل من مساحة العمل وجداول ميزات كتالوج Unity إلى متاجر Cosmos DB عبر الإنترنت. يتطلب هذا Databricks Runtime 13.0 ML أو أعلى.

databricks-feature-store 0.10.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.9.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.8.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.7.1

  • أضف flask كتبعية لإصلاح مشكلة التبعية المفقودة عند تسجيل النماذج باستخدام score_batch.

databricks-feature-store 0.7.0

  • إصلاحات وتحسينات الأخطاء الصغيرة.

databricks-feature-store 0.6.1

  • الإصدار العام الأولي لعميل Databricks Feature Store إلى PyPI.