خيارات تنسيق البيانات

يحتوي Azure Databricks على روابط كلمات أساسية مضمنة لجميع تنسيقات البيانات المدعومة أصلا من قبل Apache Spark. يستخدم Azure Databricks Delta Lake كبروتوكول افتراضي لقراءة البيانات والجداول وكتابتها، بينما يستخدم Apache Spark Parquet.

توفر هذه المقالات نظرة عامة على العديد من الخيارات والتكوينات المتوفرة عند الاستعلام عن البيانات على Azure Databricks.

تحتوي تنسيقات البيانات التالية على تكوينات كلمات أساسية مضمنة في Apache Spark DataFrames وSQL:

يوفر Azure Databricks أيضا كلمة أساسية مخصصة لتحميل تجارب MLflow.

تنسيقات البيانات مع اعتبارات خاصة

تتطلب بعض تنسيقات البيانات تكوينا إضافيا أو اعتبارات خاصة للاستخدام:

  • توصي Databricks بتحميل الصور كبيانات binary .
  • يمكن ل Azure Databricks قراءة الملفات المضغوطة مباشرة في العديد من تنسيقات الملفات. يمكنك أيضا فك ضغط الملفات المضغوطة على Azure Databricks إذا لزم الأمر.
  • يتطلب LZO تثبيت برنامج ترميز.

لمزيد من المعلومات حول مصادر بيانات Apache Spark، راجع دوال التحميل/الحفظ العامة وخيارات مصدر الملفات العامة.