تحديثات صيانة وقت تشغيل Databricks
تسرد هذه المقالة تحديثات الصيانة لإصدارات وقت تشغيل Databricks المدعومة. لإضافة تحديث صيانة إلى نظام مجموعة موجود، أعد تشغيل نظام المجموعة. للحصول على تحديثات الصيانة على إصدارات وقت تشغيل Databricks غير المدعومة، راجع تحديثات الصيانة لوقت تشغيل Databricks (مؤرشف).
إشعار
يتم تنظيم الإصدارات. قد لا يتم تحديث حساب Azure Databricks لبضعة أيام بعد تاريخ الإصدار الأولي.
إصدارات وقت تشغيل Databricks
تحديثات الصيانة حسب الإصدار:
- Databricks Runtime 15.0
- Databricks Runtime 14.3
- Databricks Runtime 14.2
- Databricks Runtime 14.1
- Databricks Runtime 13.3 LTS
- Databricks Runtime 12.2 LTS
- Databricks Runtime 11.3 LTS
- Databricks Runtime 10.4 LTS
- Databricks Runtime 9.1 LTS
Databricks Runtime 15.0
راجع Databricks Runtime 15.0.
- 25 أبريل 2024
- [SPARK-47786] يجب ألا تصبح SELECT DISTINCT () بنية SELECT DISTINCT () (العودة إلى السلوك السابق)
- [SPARK-47802][SQL] العودة () من معنى البنية () إلى المعنى *
- [SPARK-47509][SQL] حظر تعبيرات الاستعلام الفرعي في lambda ووظائف الترتيب الأعلى
- [SPARK-47722] انتظر حتى ينتهي عمل خلفية RocksDB قبل الإغلاق
- [SPARK-47081][CONNECT] [متابعة] تحسين قابلية استخدام معالج التقدم
- [SPARK-47694][CONNECT] جعل الحد الأقصى لحجم الرسالة قابلا للتكوين على جانب العميل
- [SPARK-47669][SQL] [CONNECT] [PYTHON] اضافه
Column.try_cast
- [SPARK-47664][PYTHON] [CONNECT] [Cherry-pick-15.0] التحقق من صحة اسم العمود باستخدام المخطط المخزن مؤقتا
- [SPARK-47818][CONNECT] [Cherry-pick-15.0] تقديم ذاكرة التخزين المؤقت للخطة في Spark الاتصال Planner لتحسين أداء طلبات التحليل
- [SPARK-47704][SQL] فشل تحليل JSON مع "java.lang.ClassCastException" عند تمكين spark.sql.json.enablePartialResults
- [SPARK-47755][CONNECT] يجب أن يفشل Pivot عندما يكون عدد القيم المميزة كبيرا جدا
- [SPARK-47713][SQL] [CONNECT] إصلاح فشل الانضمام الذاتي
- [SPARK-47812][CONNECT] دعم تسلسل SparkSession لعامل ForEachBatch
- [SPARK-47828][CONNECT] [PYTHON]
DataFrameWriterV2.overwrite
فشل مع خطة غير صالحة - [SPARK-47862][PYTHON] [CONNECT] إصلاح إنشاء ملفات proto
- [SPARK-47800][SQL] إنشاء أسلوب جديد للمعرف لتحويل tableIdentifier
- تحديثات أمان نظام التشغيل.
- 3 أبريل 2024
- (تغيير السلوك) لضمان سلوك متسق عبر أنواع الحوسبة، تطابق PySpark UDFs على المجموعات المشتركة الآن سلوك UDFs على أنظمة المجموعات المعينة دون عزل. يتضمن هذا التحديث التغييرات التالية التي قد تؤدي إلى قطع التعليمات البرمجية الموجودة:
- لم تعد UDFs ذات
string
نوع إرجاع تحول ضمنيا القيم غيرstring
إلىstring
قيم. في السابق، كانت UDFs ذات نوعstr
الإرجاع تقوم بتضمين القيمة المرجعة مع دالةstr()
بغض النظر عن نوع البيانات الفعلي للقيمة التي تم إرجاعها. - لم تعد UDFs ذات
timestamp
أنواع العائدات تطبق ضمنيا تحويلا إلىtimestamp
باستخدامtimezone
. - لم تعد تكوينات
spark.databricks.sql.externalUDF.*
نظام مجموعة Spark تنطبق على PySpark UDFs على المجموعات المشتركة. - لم يعد تكوين
spark.databricks.safespark.externalUDF.plan.limit
نظام مجموعة Spark يؤثر على PySpark UDFs، مما يزيل قيود المعاينة العامة البالغة 5 UDFs لكل استعلام ل PySpark UDFs. - لم يعد تكوين
spark.databricks.safespark.sandbox.size.default.mib
نظام مجموعة Spark ينطبق على PySpark UDFs على المجموعات المشتركة. بدلا من ذلك، يتم استخدام الذاكرة المتوفرة على النظام. للحد من ذاكرة PySpark UDFs، استخدمspark.databricks.pyspark.udf.isolation.memoryLimit
مع الحد الأدنى من100m
القيمة .
- لم تعد UDFs ذات
TimestampNTZ
يتم الآن دعم نوع البيانات ك عمود تجميع مع تكوين أنظمة مجموعات سائلة. راجع استخدام التجميع السائل لجداول Delta.- [SPARK-47218][SQL] XML: تجاهل علامات الصف التي تم التعليق عليها في رمز XML المميز
- [SPARK-46990][SQL] إصلاح تحميل ملفات Avro الفارغة المنبعثة من مراكز الأحداث
- [SPARK-47033][SQL] إصلاح EXECUTE IMMEDIATE USING لا يتعرف على أسماء متغيرات جلسة العمل
- [SPARK-47368][SQL] إزالة التحقق من تكوين inferTimestampNTZ في ParquetRowConverter
- [SPARK-47561][SQL] إصلاح مشكلات ترتيب قاعدة المحلل حول الاسم المستعار
- [SPARK-47638][PS] [CONNECT] تخطي التحقق من صحة اسم العمود في PS
- [BACKPORT] [[SPARK-46906]]https://issues.apache.org/jira/browse/SPARK-46906) [SS] إضافة فحص لتغيير عامل التشغيل ذي الحالة للبث
- [SPARK-47569][SQL] عدم السماح بمقارنة المتغير.
- [SPARK-47241][SQL] إصلاح مشكلات ترتيب القواعد ل ExtractGenerator
- [SPARK-47218] [SQL] XML: تم تغيير SchemaOfXml للفشل في وضع DROPMALFORMED
- [SPARK-47300][SQL]
quoteIfNeeded
يجب أن يبدأ معرف عرض الأسعار بأرقام - [SPARK-47009][SQL] [ترتيب] تمكين إنشاء دعم الجدول للترتر
- [SPARK-47322][PYTHON] [CONNECT] جعل
withColumnsRenamed
معالجة تكرار أسماء الأعمدة متسقة معwithColumnRenamed
- [SPARK-47544][PYTHON] أسلوب منشئ SparkSession غير متوافق مع visual studio code intellisense
- [SPARK-47511][SQL] التعابير المتعارف عليها عن طريق إعادة تعيين المعرف
- [SPARK-47385] إصلاح مرمزات المجموعة باستخدام إدخالات الخيار.
- [SPARK-47200][SS] فئة الخطأ لخطأ دالة مستخدم متلقي دفعة Foreach
- [SPARK-47135][SS] تنفيذ فئات الخطأ لاستثناءات فقدان بيانات Kafka
- [SPARK-38708][SQL] ترقية عميل Hive Metastore إلى 3.1.3 ل Hive 3.1
- [SPARK-47305][SQL] إصلاح PruneFilters لوضع علامة isStreaming ل LocalRelation بشكل صحيح عندما تحتوي الخطة على كل من الدفعة والتدفق
- [SPARK-47380][CONNECT] تأكد من جانب الخادم أن SparkSession هو نفسه
- تحديثات أمان نظام التشغيل.
- (تغيير السلوك) لضمان سلوك متسق عبر أنواع الحوسبة، تطابق PySpark UDFs على المجموعات المشتركة الآن سلوك UDFs على أنظمة المجموعات المعينة دون عزل. يتضمن هذا التحديث التغييرات التالية التي قد تؤدي إلى قطع التعليمات البرمجية الموجودة:
Databricks Runtime 14.3
راجع Databricks Runtime 14.3 LTS.
- 25 أبريل 2024
- [SPARK-47543][CONNECT] [PYTHON] الاستدلال
dict
منMapType
Pandas DataFrame للسماح بإنشاء DataFrame - [SPARK-47694][CONNECT] جعل الحد الأقصى لحجم الرسالة قابلا للتكوين على جانب العميل
- [SPARK-47664][PYTHON] [CONNECT] [Cherry-pick-14.3] التحقق من صحة اسم العمود باستخدام المخطط المخزن مؤقتا
- [SPARK-47862][PYTHON] [CONNECT] إصلاح إنشاء ملفات proto
- العودة إلى "[SPARK-47543][CONNECT][PYTHON] الاستدلال
dict
كما هو الحالMapType
من Pandas DataFrame للسماح بإنشاء DataFrame" - [SPARK-47704][SQL] فشل تحليل JSON مع "java.lang.ClassCastException" عند تمكين spark.sql.json.enablePartialResults
- [SPARK-47812][CONNECT] دعم تسلسل SparkSession لعامل ForEachBatch
- [SPARK-47818][CONNECT] [Cherry-pick-14.3] تقديم ذاكرة التخزين المؤقت للخطة في Spark الاتصال Planner لتحسين أداء طلبات التحليل
- [SPARK-47828][CONNECT] [PYTHON]
DataFrameWriterV2.overwrite
فشل مع خطة غير صالحة - تحديثات أمان نظام التشغيل.
- [SPARK-47543][CONNECT] [PYTHON] الاستدلال
- 6 أبريل 2024
- (تغيير السلوك) لضمان سلوك متسق عبر أنواع الحوسبة، تطابق PySpark UDFs على المجموعات المشتركة الآن سلوك UDFs على أنظمة المجموعات المعينة دون عزل. يتضمن هذا التحديث التغييرات التالية التي قد تؤدي إلى قطع التعليمات البرمجية الموجودة:
- لم تعد UDFs ذات
string
نوع إرجاع تحول ضمنيا القيم غيرstring
إلىstring
قيم. في السابق، كانت UDFs ذات نوعstr
الإرجاع تقوم بتضمين القيمة المرجعة مع دالةstr()
بغض النظر عن نوع البيانات الفعلي للقيمة التي تم إرجاعها. - لم تعد UDFs ذات
timestamp
أنواع العائدات تطبق ضمنيا تحويلا إلىtimestamp
باستخدامtimezone
. - لم تعد تكوينات
spark.databricks.sql.externalUDF.*
نظام مجموعة Spark تنطبق على PySpark UDFs على المجموعات المشتركة. - لم يعد تكوين
spark.databricks.safespark.externalUDF.plan.limit
نظام مجموعة Spark يؤثر على PySpark UDFs، مما يزيل قيود المعاينة العامة البالغة 5 UDFs لكل استعلام ل PySpark UDFs. - لم يعد تكوين
spark.databricks.safespark.sandbox.size.default.mib
نظام مجموعة Spark ينطبق على PySpark UDFs على المجموعات المشتركة. بدلا من ذلك، يتم استخدام الذاكرة المتوفرة على النظام. للحد من ذاكرة PySpark UDFs، استخدمspark.databricks.pyspark.udf.isolation.memoryLimit
مع الحد الأدنى من100m
القيمة .
- لم تعد UDFs ذات
TimestampNTZ
يتم الآن دعم نوع البيانات ك عمود تجميع مع تكوين أنظمة مجموعات سائلة. راجع استخدام التجميع السائل لجداول Delta.- [SPARK-47511][SQL] التعابير المتعارف عليها عن طريق إعادة تعيين المعرف
- [SPARK-47509][SQL] حظر تعبيرات الاستعلام الفرعي في lambda ووظائف الترتيب الأعلى
- [SPARK-46990][SQL] إصلاح تحميل ملفات Avro الفارغة المنبعثة من مراكز الأحداث
- [SPARK-47638][PS] [CONNECT] تخطي التحقق من صحة اسم العمود في PS
- تحديثات أمان نظام التشغيل.
- (تغيير السلوك) لضمان سلوك متسق عبر أنواع الحوسبة، تطابق PySpark UDFs على المجموعات المشتركة الآن سلوك UDFs على أنظمة المجموعات المعينة دون عزل. يتضمن هذا التحديث التغييرات التالية التي قد تؤدي إلى قطع التعليمات البرمجية الموجودة:
- 3 يناير 2024
- [SPARK-46933] إضافة مقياس وقت تنفيذ الاستعلام إلى الموصلات التي تستخدم JDBCRDD.
- [SPARK-46763] إصلاح فشل التأكيد في ReplaceDeduplicateWithAggregate للسمات المكررة.
- [SPARK-46954] XML: التفاف InputStreamReader مع BufferedReader.
- [SPARK-46655] تخطي اللحاق بسياق الاستعلام في
DataFrame
الأساليب. - [SPARK-44815] ذاكرة التخزين المؤقت df.schema لتجنب RPC إضافية.
- [SPARK-46952] XML: حد حجم السجل التالف.
- [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- [SPARK-46736] الاحتفاظ بحقل رسالة فارغ في موصل protobuf.
- [SPARK-45182] تجاهل إكمال المهمة من المرحلة القديمة بعد إعادة محاولة مرحلة الأصل غير المحدد كما هو محدد بواسطة المجموع الاختباري.
- [SPARK-46414] استخدم prependBaseUri لعرض استيرادات javascript.
- [SPARK-46383] تقليل استخدام كومة برامج التشغيل عن طريق تقليل عمر
TaskInfo.accumulables()
. - [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- [SPARK-46954] XML: تحسين بحث فهرس المخطط.
- [SPARK-46676] يجب ألا يفشل dropDuplicatesWithinWatermark عند المتعارف عليه للخطة.
- [SPARK-46644] تغيير الإضافة والدمج في SQLMetric لاستخدام isZero.
- [SPARK-46731] إدارة مثيل موفر مخزن الحالة حسب مصدر بيانات الحالة - القارئ.
- [SPARK-46677] إصلاح
dataframe["*"]
الدقة. - [SPARK-46610] يجب أن يطرح إنشاء جدول استثناء عندما لا تكون هناك قيمة لمفتاح في الخيارات.
- [SPARK-46941] لا يمكن إدراج عقدة حد مجموعة نافذة لحساب أعلى k إذا كان يحتوي على SizeBasedWindowFunction.
- [SPARK-45433] إصلاح استنتاج مخطط CSV/JSON عندما لا تتطابق الطوابع الزمنية مع تنسيق الطابع الزمني المحدد.
- [SPARK-46930] إضافة دعم لبادئة مخصصة لحقول نوع الاتحاد في Avro.
- [SPARK-46227] Backport إلى 14.3.
- [SPARK-46822] احترام spark.sql.legacy.charVarcharAsString عند تحويل نوع jdbc إلى نوع المحفز في jdbc.
- تحديثات أمان نظام التشغيل.
Databricks Runtime 14.2
راجع Databricks Runtime 14.2.
- 25 أبريل 2024
- [SPARK-47704][SQL] فشل تحليل JSON مع "java.lang.ClassCastException" عند تمكين spark.sql.json.enablePartialResults
- [SPARK-47828][CONNECT] [PYTHON]
DataFrameWriterV2.overwrite
فشل مع خطة غير صالحة - تحديثات أمان نظام التشغيل.
- 9 أبريل 2024
- بلا
- [SPARK-47309][SQL] [XML] إضافة اختبارات وحدة استنتاج المخطط
- [SPARK-46990][SQL] إصلاح تحميل ملفات Avro الفارغة المنبعثة من مراكز الأحداث
- [SPARK-47638][PS] [CONNECT] تخطي التحقق من صحة اسم العمود في PS
- [SPARK-47509][SQL] حظر تعبيرات الاستعلام الفرعي في lambda ووظائف الترتيب الأعلى
- [SPARK-38708][SQL] ترقية عميل Hive Metastore إلى 3.1.3 ل Hive 3.1
- تحديثات أمان نظام التشغيل.
- 8 فبراير 2024
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
APPLY CHANGES
الموجودة في Databricks Runtime 14.1 والإحدث. استعلامات CDF غير مدعومة مع جداول دفق كتالوج Unity في Databricks Runtime 14.0 والإصدارات السابقة. - [SPARK-46930] إضافة دعم لبادئة مخصصة لحقول نوع الاتحاد في Avro.
- [SPARK-46822] احترام spark.sql.legacy.charVarcharAsString عند تحويل نوع jdbc إلى نوع المحفز في jdbc.
- [SPARK-46952] XML: حد حجم السجل التالف.
- [SPARK-46644] تغيير الإضافة والدمج في SQLMetric لاستخدام isZero.
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- [SPARK-46941] لا يمكن إدراج عقدة حد مجموعة نافذة لحساب أعلى k إذا كان يحتوي على SizeBasedWindowFunction.
- [SPARK-46933] إضافة مقياس وقت تنفيذ الاستعلام إلى الموصلات التي تستخدم JDBCRDD.
- تحديثات أمان نظام التشغيل.
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
- 31 يناير 2024
- [SPARK-46382] XML: تحديث مستند ل
ignoreSurroundingSpaces
. - [SPARK-46382] XML: التقاط القيم المتداخلة بين العناصر.
- [SPARK-46763] إصلاح فشل التأكيد في ReplaceDeduplicateWithAggregate للسمات المكررة.
- Revert [SPARK-46769] تحسين استنتاج المخطط ذي الصلة بالطوابع الزمنية.
- [SPARK-46677] إصلاح
dataframe["*"]
الدقة. - [SPARK-46382] XML: الافتراضي يتجاهل المساحات المتجولة إلى true.
- [SPARK-46633] إصلاح قارئ Avro للتعامل مع الكتل ذات الطول الصفري.
- [SPARK-45964] قم بإزالة ملحق sql الخاص في حزمة XML وJSON ضمن حزمة المحفز.
- [SPARK-46581] تحديث التعليق على isZero في AccumulatorV2.
- [SPARK-45912] تحسين واجهة برمجة تطبيقات XSDToSchema: قم بالتغيير إلى واجهة برمجة تطبيقات HDFS لإمكانية وصول ذوي الاحتياجات الخاصة إلى التخزين السحابي.
- [SPARK-45182] تجاهل إكمال المهمة من المرحلة القديمة بعد إعادة محاولة مرحلة الأصل غير المحدد كما هو محدد بواسطة المجموع الاختباري.
- [SPARK-46660] تقوم طلبات إعادة التتبع بتحديثات فعالية SessionHolder.
- [SPARK-46610] يجب أن يطرح إنشاء جدول استثناء عندما لا تكون هناك قيمة لمفتاح في الخيارات.
- [SPARK-46383] تقليل استخدام كومة برامج التشغيل عن طريق تقليل عمر
TaskInfo.accumulables()
. - [SPARK-46769] تحسين استنتاج المخطط ذي الصلة بالطوابع الزمنية.
- [SPARK-46684] إصلاح CoGroup.applyInPandas/السهم لتمرير الوسيطات بشكل صحيح.
- [SPARK-46676] يجب ألا يفشل dropDuplicatesWithinWatermark عند المتعارف عليه للخطة.
- [SPARK-45962] الخيار إزالة
treatEmptyValuesAsNulls
واستخدامnullValue
بدلا من ذلك في XML. - [SPARK-46541] إصلاح مرجع العمود الغامض في الصلة الذاتية.
- [SPARK-46599] XML: استخدم TypeCoercion.findTightestCommonType للتحقق من التوافق.
- تحديثات أمان نظام التشغيل.
- [SPARK-46382] XML: تحديث مستند ل
- 17 يناير 2024
shuffle
يتم تحديث عقدة خطة الشرح التي تم إرجاعها بواسطة استعلام Photon لإضافةcausedBroadcastJoinBuildOOM=true
العلامة عند حدوث خطأ نفاد الذاكرة أثناء التبديل العشوائي الذي يعد جزءا من صلة البث.- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46261]
DataFrame.withColumnsRenamed
يجب أن تحافظ على ترتيب الإملاء/الخريطة. - [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-46145] لا تطرح spark.catalog.listTables استثناء عند عدم العثور على الجدول أو طريقة العرض.
- [SPARK-46484] اجعل
resolveOperators
وظائف المساعد تحتفظ ب معرف الخطة. - [SPARK-46394] إصلاح مشكلات spark.catalog.listDatabases() على المخططات ذات الأحرف الخاصة عند
spark.sql.legacy.keepCommandOutputSchema
تعيينها إلى true. - [SPARK-46609] تجنب الانفجار الأسي في PartitioningPreservingUnaryExecNode.
- [SPARK-46446] تعطيل الاستعلامات الفرعية باستخدام OFFSET المرتبطة لإصلاح خطأ التصحيح.
- [SPARK-46152] XML: إضافة دعم DecimalType في استنتاج مخطط XML.
- [SPARK-46602] النشر
allowExisting
في إنشاء طريقة العرض عندما لا يكون العرض/الجدول موجودا. - [SPARK-45814] اجعل مكالمة سهمConverters.createEmptyArrowBatch قريبة() لتجنب تسرب الذاكرة.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- [SPARK-46600] نقل التعليمات البرمجية المشتركة بين SqlConf وSqlApiConf إلى SqlApiConfHelper.
- [SPARK-46478] قم بإعادة SPARK-43049 لاستخدام oracle varchar(255) للسلسلة.
- [SPARK-46417] لا تفشل عند استدعاء hive.getTable و throwException خطأ.
- [SPARK-46153] XML: إضافة دعم TimestampNTZType.
- [BACKPORT] [[SPARK-46056]]https://issues.apache.org/jira/browse/SPARK-46056) إصلاح NPE للقراءة المتجهة Parquet بالقيمة الافتراضية byteArrayDecimalType.
- [SPARK-46466] يجب ألا يقوم قارئ باركيه المتجه بإعادة قاعدة البيانات للطوابع الزمنية ntz.
- [SPARK-46260]
DataFrame.withColumnsRenamed
يجب أن تحترم ترتيب الإملاء. - [SPARK-46036] إزالة فئة الخطأ من الدالة raise_error.
- [SPARK-46294] تنظيف دلالات init مقابل القيمة الصفرية.
- [SPARK-46173] تخطي trimAll call أثناء تحليل التاريخ.
- [SPARK-46250] test_parity_listener deflake.
- [SPARK-46587] XML: إصلاح تحويل عدد صحيح كبير ل XSD.
- [SPARK-46396] يجب ألا يطرح استدلال الطابع الزمني استثناء.
- [SPARK-46241] إصلاح روتين معالجة الأخطاء حتى لا يقع في الإعادة اللانهائية.
- [SPARK-46355] XML: أغلق InputStreamReader عند اكتمال القراءة.
- [SPARK-46370] إصلاح الخطأ عند الاستعلام من الجدول بعد تغيير الإعدادات الافتراضية للعمود.
- [SPARK-46265] تجعل التأكيدات في AddArtifact RPC عميل الاتصال غير متوافق مع المجموعات القديمة.
- [SPARK-46308] منع معالجة الأخطاء المتكررة.
- [SPARK-46337] اجعل
CTESubstitution
الاحتفاظ بPLAN_ID_TAG
.
- 14 ديسمبر 2023
- [SPARK-46141] قم بتغيير الإعداد الافتراضي ل spark.sql.legacy.ctePrecedencePolicy إلى CORRECTED.
- [SPARK-45730] اجعل ReloadingX509TrustManagerSuite أقل خفقان.
- [SPARK-45852] التعامل بأمان مع خطأ الإعادة أثناء التسجيل.
- [SPARK-45808] معالجة الأخطاء بشكل أفضل لاستثناءات SQL.
- [SPARK-45920] يجب أن تكون المجموعة حسب الترتيبية غير متكررة.
- العودة "[SPARK-45649] توحيد إطار عمل التحضير ل
OffsetWindowFunctionFrame
". - [SPARK-45733] دعم نهج إعادة المحاولة المتعددة.
- [SPARK-45509] إصلاح السلوك المرجعي لعمود df ل Spark الاتصال.
- [SPARK-45655] السماح بتعبيرات غير محددة داخل AggregateFunctions في CollectMetrics.
- [SPARK-45905] يجب أن يحتفظ النوع الأقل شيوعا بين الأنواع العشرية بالأرقام المتكاملة أولا.
- [SPARK-45136] تحسين ClosureCleaner مع دعم Ammonite.
- [SPARK-46255] دعم النوع المعقد -> تحويل السلسلة.
- [SPARK-45859] جعل كائنات UDF في ml.functions كسولة.
- [SPARK-46028] جعل
Column.__getitem__
عمود الإدخال يقبل. - [SPARK-45798] تأكيد معرف جلسة العمل من جانب الخادم.
- [SPARK-45892] التحقق من صحة خطة محسن إعادة بناء التعليمات البرمجية
validateSchemaOutput
لفصل وvalidateExprIdUniqueness
. - [SPARK-45844] تنفيذ حساسية حالة الأحرف ل XML.
- [SPARK-45770] تقديم خطة
DataFrameDropColumns
لDataframe.drop
. - [SPARK-44790] XML: to_xml التنفيذ والروابط ل python والاتصال وSQL.
- [SPARK-45851] دعم نهج متعددة في عميل scala.
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - تم إصلاح مشكلة حيث تم تفسير التسطير السفلي الهارب في
getColumns
العمليات التي تنشأ من عملاء JDBC أو ODBC بشكل خاطئ على أنها أحرف بدل. - [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-45852] عميل Python ل Spark الاتصال الآن يلتقط أخطاء الإعادة أثناء تحويل النص.
- [SPARK-45808] معالجة الأخطاء المحسنة لاستثناءات SQL.
- [SPARK-45920]
GROUP BY
الترتيبي لا يحل محل الترتيبي. - العودة [SPARK-45649].
- [SPARK-45733] دعم إضافي لنهج إعادة المحاولة المتعددة.
- [SPARK-45509] سلوك مرجع العمود الثابت
df
ل Spark الاتصال. - [SPARK-45655] السماح بتعبيرات غير محددة داخل
AggregateFunctions
فيCollectMetrics
. - [SPARK-45905] يحتفظ النوع الأقل شيوعا بين الأنواع العشرية الآن بالأرقام المتكاملة أولا.
- [SPARK-45136] تحسين
ClosureCleaner
مع دعم Ammonite. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - [SPARK-46028]
Column.__getitem__
يقبل أعمدة الإدخال. - [SPARK-45798] تأكيد معرف جلسة العمل من جانب الخادم.
- [SPARK-45892] التحقق من صحة خطة محسن إعادة بناء التعليمات البرمجية
validateSchemaOutput
لفصل وvalidateExprIdUniqueness
. - [SPARK-45844] تنفيذ حساسية حالة الأحرف ل XML.
- [SPARK-45770] تم إصلاح دقة العمود باستخدام
DataFrameDropColumns
لDataframe.drop
. - [SPARK-44790] تمت إضافة
to_xml
التنفيذ والروابط ل Python وSpark الاتصال وSQL. - [SPARK-45851] دعم إضافي لنهج متعددة في عميل Scala.
- تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
Databricks Runtime 14.1
راجع Databricks Runtime 14.1.
- 25 أبريل 2024
- [SPARK-47704][SQL] فشل تحليل JSON مع "java.lang.ClassCastException" عند تمكين spark.sql.json.enablePartialResults
- [SPARK-47828][CONNECT] [PYTHON]
DataFrameWriterV2.overwrite
فشل مع خطة غير صالحة - تحديثات أمان نظام التشغيل.
- 9 أبريل 2024
- بلا
- [SPARK-47638][PS] [CONNECT] تخطي التحقق من صحة اسم العمود في PS
- [SPARK-38708][SQL] ترقية عميل Hive Metastore إلى 3.1.3 ل Hive 3.1
- [SPARK-47309][SQL] [XML] إضافة اختبارات وحدة استنتاج المخطط
- [SPARK-47509][SQL] حظر تعبيرات الاستعلام الفرعي في lambda ووظائف الترتيب الأعلى
- [SPARK-46990][SQL] إصلاح تحميل ملفات Avro الفارغة المنبعثة من مراكز الأحداث
- تحديثات أمان نظام التشغيل.
- 8 فبراير 2024
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
APPLY CHANGES
الموجودة في Databricks Runtime 14.1 والإحدث. استعلامات CDF غير مدعومة مع جداول دفق كتالوج Unity في Databricks Runtime 14.0 والإصدارات السابقة. - [SPARK-46952] XML: حد حجم السجل التالف.
- [SPARK-45182] تجاهل إكمال المهمة من المرحلة القديمة بعد إعادة محاولة مرحلة الأصل غير المحدد كما هو محدد بواسطة المجموع الاختباري.
- [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- [SPARK-46933] إضافة مقياس وقت تنفيذ الاستعلام إلى الموصلات التي تستخدم JDBCRDD.
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- [SPARK-45582] تأكد من عدم استخدام مثيل المتجر بعد استدعاء التثبيت داخل تجميع تدفق وضع الإخراج.
- [SPARK-46930] إضافة دعم لبادئة مخصصة لحقول نوع الاتحاد في Avro.
- [SPARK-46941] لا يمكن إدراج عقدة حد مجموعة نافذة لحساب أعلى k إذا كان يحتوي على SizeBasedWindowFunction.
- [SPARK-46396] يجب ألا يطرح استدلال الطابع الزمني استثناء.
- [SPARK-46822] احترام spark.sql.legacy.charVarcharAsString عند تحويل نوع jdbc إلى نوع المحفز في jdbc.
- [SPARK-45957] تجنب إنشاء خطة تنفيذ للأوامر غير القابلة للتنفيذ.
- تحديثات أمان نظام التشغيل.
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
- 31 يناير 2024
- [SPARK-46684] إصلاح CoGroup.applyInPandas/السهم لتمرير الوسيطات بشكل صحيح.
- [SPARK-46763] إصلاح فشل التأكيد في ReplaceDeduplicateWithAggregate للسمات المكررة.
- [SPARK-45498] المتابعة: تجاهل إكمال المهمة من محاولات المرحلة القديمة.
- [SPARK-46382] XML: تحديث مستند ل
ignoreSurroundingSpaces
. - [SPARK-46383] تقليل استخدام كومة برامج التشغيل عن طريق تقليل عمر
TaskInfo.accumulables()
. - [SPARK-46382] XML: الافتراضي يتجاهل المساحات المتجولة إلى true.
- [SPARK-46677] إصلاح
dataframe["*"]
الدقة. - [SPARK-46676] يجب ألا يفشل dropDuplicatesWithinWatermark عند المتعارف عليه للخطة.
- [SPARK-46633] إصلاح قارئ Avro للتعامل مع الكتل ذات الطول الصفري.
- [SPARK-45912] تحسين واجهة برمجة تطبيقات XSDToSchema: قم بالتغيير إلى واجهة برمجة تطبيقات HDFS لإمكانية وصول ذوي الاحتياجات الخاصة إلى التخزين السحابي.
- [SPARK-46599] XML: استخدم TypeCoercion.findTightestCommonType للتحقق من التوافق.
- [SPARK-46382] XML: التقاط القيم المتداخلة بين العناصر.
- [SPARK-46769] تحسين استنتاج المخطط ذي الصلة بالطوابع الزمنية.
- [SPARK-46610] يجب أن يطرح إنشاء جدول استثناء عندما لا تكون هناك قيمة لمفتاح في الخيارات.
- [SPARK-45964] قم بإزالة ملحق sql الخاص في حزمة XML وJSON ضمن حزمة المحفز.
- Revert [SPARK-46769] تحسين استنتاج المخطط ذي الصلة بالطوابع الزمنية.
- [SPARK-45962] الخيار إزالة
treatEmptyValuesAsNulls
واستخدامnullValue
بدلا من ذلك في XML. - [SPARK-46541] إصلاح مرجع العمود الغامض في الصلة الذاتية.
- تحديثات أمان نظام التشغيل.
- 17 يناير 2024
shuffle
يتم تحديث عقدة خطة الشرح التي تم إرجاعها بواسطة استعلام Photon لإضافةcausedBroadcastJoinBuildOOM=true
العلامة عند حدوث خطأ نفاد الذاكرة أثناء التبديل العشوائي الذي يعد جزءا من صلة البث.- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-46417] لا تفشل عند استدعاء hive.getTable و throwException خطأ.
- [SPARK-46484] اجعل
resolveOperators
وظائف المساعد تحتفظ ب معرف الخطة. - [SPARK-46153] XML: إضافة دعم TimestampNTZType.
- [SPARK-46152] XML: إضافة دعم DecimalType في استنتاج مخطط XML.
- [SPARK-46145] لا تطرح spark.catalog.listTables استثناء عند عدم العثور على الجدول أو طريقة العرض.
- [SPARK-46478] قم بإعادة SPARK-43049 لاستخدام oracle varchar(255) للسلسلة.
- [SPARK-46394] إصلاح مشكلات spark.catalog.listDatabases() على المخططات ذات الأحرف الخاصة عند
spark.sql.legacy.keepCommandOutputSchema
تعيينها إلى true. - [SPARK-46337] اجعل
CTESubstitution
الاحتفاظ بPLAN_ID_TAG
. - [SPARK-46466] يجب ألا يقوم قارئ باركيه المتجه بإعادة قاعدة البيانات للطوابع الزمنية ntz.
- [SPARK-46587] XML: إصلاح تحويل عدد صحيح كبير ل XSD.
- [SPARK-45814] اجعل مكالمة سهمConverters.createEmptyArrowBatch قريبة() لتجنب تسرب الذاكرة.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- [SPARK-46602] النشر
allowExisting
في إنشاء طريقة العرض عندما لا يكون العرض/الجدول موجودا. - [SPARK-46173] تخطي trimAll call أثناء تحليل التاريخ.
- [SPARK-46355] XML: أغلق InputStreamReader عند اكتمال القراءة.
- [SPARK-46600] نقل التعليمات البرمجية المشتركة بين SqlConf وSqlApiConf إلى SqlApiConfHelper.
- [SPARK-46261]
DataFrame.withColumnsRenamed
يجب أن تحافظ على ترتيب الإملاء/الخريطة. - [SPARK-46056] إصلاح NPE للقراءة المتجهة Parquet بالقيمة الافتراضية byteArrayDecimalType.
- [SPARK-46260]
DataFrame.withColumnsRenamed
يجب أن تحترم ترتيب الإملاء. - [SPARK-46250] test_parity_listener deflake.
- [SPARK-46370] إصلاح الخطأ عند الاستعلام من الجدول بعد تغيير الإعدادات الافتراضية للعمود.
- [SPARK-46609] تجنب الانفجار الأسي في PartitioningPreservingUnaryExecNode.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- 14 ديسمبر 2023
- تم إصلاح مشكلة حيث تمت معالجة التسطير السفلي الهارب في عمليات getColumns التي تنشأ من عملاء JDBC أو ODBC بشكل غير صحيح وتفسيرها كأحرف بدل.
- [SPARK-45509] إصلاح السلوك المرجعي لعمود df ل Spark الاتصال.
- [SPARK-45844] تنفيذ حساسية حالة الأحرف ل XML.
- [SPARK-46141] قم بتغيير الإعداد الافتراضي ل spark.sql.legacy.ctePrecedencePolicy إلى CORRECTED.
- [SPARK-46028] جعل
Column.__getitem__
عمود الإدخال يقبل. - [SPARK-46255] دعم النوع المعقد -> تحويل السلسلة.
- [SPARK-45655] السماح بتعبيرات غير محددة داخل AggregateFunctions في CollectMetrics.
- [SPARK-45433] إصلاح استنتاج مخطط CSV/JSON عندما لا تتطابق الطوابع الزمنية مع تنسيق الطابع الزمني المحدد.
- [SPARK-45316] إضافة معلمات
ignoreCorruptFiles
/ignoreMissingFiles
جديدة إلىHadoopRDD
وNewHadoopRDD
. - [SPARK-45852] التعامل بأمان مع خطأ الإعادة أثناء التسجيل.
- [SPARK-45920] يجب أن تكون المجموعة حسب الترتيبية غير متكررة.
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - تم إصلاح مشكلة حيث تم تفسير التسطير السفلي الهارب في
getColumns
العمليات التي تنشأ من عملاء JDBC أو ODBC بشكل خاطئ على أنها أحرف بدل. - عند استيعاب بيانات CSV باستخدام التحميل التلقائي أو جداول البث، يتم الآن تقسيم ملفات CSV الكبيرة ويمكن معالجتها بالتوازي أثناء كل من استنتاج المخطط ومعالجة البيانات.
- [SPARK-45892] التحقق من صحة خطة محسن إعادة بناء التعليمات البرمجية
validateSchemaOutput
لفصل وvalidateExprIdUniqueness
. - [SPARK-45620] تستخدم واجهات برمجة التطبيقات المتعلقة ب Python UDF الآن camelCase.
- [SPARK-44790] تمت إضافة
to_xml
التنفيذ والروابط ل Python وSpark الاتصال وSQL. - [SPARK-45770] تم إصلاح دقة العمود باستخدام
DataFrameDropColumns
لDataframe.drop
. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-44784] جعل اختبار SBT hermetic.
- تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 10 نوفمبر 2023
- [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - [SPARK-45250] دعم إضافي لملف تعريف موارد المهمة على مستوى المرحلة لمجموعات الغزل عند إيقاف تشغيل التخصيص الديناميكي.
- [SPARK-44753] تمت إضافة قارئ وكاتب XML DataFrame ل PySpark SQL.
- [SPARK-45396] إضافة إدخال مستند للوحدة النمطية
PySpark.ml.connect
. - [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - [SPARK-45541] تمت إضافة SSLFactory.
- [SPARK-45577] تم التصحيح
UserDefinedPythonTableFunctionAnalyzeRunner
لتمرير القيم المطوية من الوسيطات المسماة. - [SPARK-45562] جعل 'rowTag' خيارا مطلوبا.
- [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - [SPARK-43380] تباطؤ ثابت في قراءة Avro.
- [SPARK-45430]
FramelessOffsetWindowFunction
لم يعد يفشل عندماIGNORE NULLS
وoffset > rowCount
. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- [SPARK-45386] تم إصلاح مشكلة إرجاع
StorageLevel.NONE
0 بشكل غير صحيح. - [SPARK-44219] تمت إضافة عمليات التحقق من الصحة لكل قاعدة لإعادة كتابة التحسين.
- [SPARK-45543] تم إصلاح مشكلة كانت تتسبب
InferWindowGroupLimit
في حدوث مشكلة إذا لم يكن لوظائف النافذة الأخرى نفس إطار النافذة مثل الدالات المماثلة للرتبة. - تحديثات أمان نظام التشغيل.
- [SPARK-45545]
- 27 سبتمبر 2023
- [SPARK-44823] تم التحديث
black
إلى 23.9.1 والتدقيق الخاطئ الثابت. - [SPARK-45339] يسجل PySpark الآن الأخطاء التي يعيد المحاولة.
- Revert [SPARK-42946] بيانات حساسة منقحة متداخلة ضمن استبدالات متغيرة.
- [SPARK-44551] التعليقات المحررة للمزامنة مع OSS.
- [SPARK-45360] يدعم منشئ جلسة Spark التهيئة من
SPARK_REMOTE
. - [SPARK-45279] مرفق
plan_id
بجميع الخطط المنطقية. - [SPARK-45425] تم التعيين
TINYINT
إلىShortType
لMsSqlServerDialect
. - [SPARK-45419] تمت إزالة إدخال مخطط إصدار الملف للإصدارات الأكبر لتجنب إعادة استخدام
rocksdb
معرفات الملفات sst. - [SPARK-45488] دعم إضافي للقيمة في
rowTag
العنصر. - [SPARK-42205] تمت إزالة تسجيل في
Accumulables
Task/Stage
أحداث البدء فيJsonProtocol
سجلات الأحداث. - [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - [SPARK-45256]
DurationWriter
يفشل عند كتابة قيم أكثر من السعة الأولية. - [SPARK-43380] إصلاح
Avro
مشكلات تحويل نوع البيانات دون التسبب في تراجع الأداء. - [SPARK-45182] دعم إضافي لمرحلة خريطة التبديل العشوائي مرة أخرى بحيث يمكن إعادة محاولة جميع مهام المرحلة عندما يكون إخراج المرحلة غير محدد.
- [SPARK-45399] تمت إضافة خيارات XML باستخدام
newOption
. - تحديثات أمان نظام التشغيل.
- [SPARK-44823] تم التحديث
Databricks Runtime 13.3 LTS
راجع Databricks Runtime 13.3 LTS.
- 25 أبريل 2024
- [SPARK-44653][SQL] يجب ألا توقف اتحادات DataFrame غير التافهة التخزين المؤقت
- إصلاحات الأخطاء المتنوعة.
- 9 أبريل 2024
- [SPARK-47509][SQL] حظر تعبيرات الاستعلام الفرعي في lambda ووظائف الترتيب الأعلى
- تحديثات أمان نظام التشغيل.
- 8 فبراير 2024
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
APPLY CHANGES
الموجودة في Databricks Runtime 14.1 والإحدث. استعلامات CDF غير مدعومة مع جداول دفق كتالوج Unity في Databricks Runtime 14.0 والإصدارات السابقة. - [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- [SPARK-46933] إضافة مقياس وقت تنفيذ الاستعلام إلى الموصلات التي تستخدم JDBCRDD.
- [SPARK-45582] تأكد من عدم استخدام مثيل المتجر بعد استدعاء التثبيت داخل تجميع تدفق وضع الإخراج.
- [SPARK-46396] يجب ألا يطرح استدلال الطابع الزمني استثناء.
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- [SPARK-46941] لا يمكن إدراج عقدة حد مجموعة نافذة لحساب أعلى k إذا كان يحتوي على SizeBasedWindowFunction.
- تحديثات أمان نظام التشغيل.
- لا يتم دعم استعلامات موجز البيانات (CDF) على طرق العرض المجسدة في كتالوج Unity، وترجع محاولة تشغيل استعلام CDF باستخدام طريقة عرض مجسدة في كتالوج Unity خطأ. تدعم جداول دفق كتالوج Unity استعلامات CDF على الجداول غير
- 31 يناير 2024
- [SPARK-46610] يجب أن يطرح إنشاء جدول استثناء عندما لا تكون هناك قيمة لمفتاح في الخيارات.
- [SPARK-46383] تقليل استخدام كومة الذاكرة المؤقتة لبرنامج التشغيل عن طريق تقليل عمر TaskInfo.accumulables().
- [SPARK-46600] نقل التعليمات البرمجية المشتركة بين SqlConf وSqlApiConf إلى SqlApiConfHelper.
- [SPARK-46676] يجب ألا يفشل dropDuplicatesWithinWatermark عند المتعارف عليه للخطة.
- [SPARK-46763] إصلاح فشل التأكيد في ReplaceDeduplicateWithAggregate للسمات المكررة.
- تحديثات أمان نظام التشغيل.
- 17 يناير 2024
shuffle
يتم تحديث عقدة خطة الشرح التي تم إرجاعها بواسطة استعلام Photon لإضافةcausedBroadcastJoinBuildOOM=true
العلامة عند حدوث خطأ نفاد الذاكرة أثناء التبديل العشوائي الذي يعد جزءا من صلة البث.- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-46173] تخطي trimAll call أثناء تحليل التاريخ.
- [SPARK-46370] إصلاح الخطأ عند الاستعلام من الجدول بعد تغيير الإعدادات الافتراضية للعمود.
- [SPARK-46370] إصلاح الخطأ عند الاستعلام من الجدول بعد تغيير الإعدادات الافتراضية للعمود.
- [SPARK-46370] إصلاح الخطأ عند الاستعلام من الجدول بعد تغيير الإعدادات الافتراضية للعمود.
- [SPARK-46609] تجنب الانفجار الأسي في PartitioningPreservingUnaryExecNode.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- [SPARK-46602] النشر
allowExisting
في إنشاء طريقة العرض عندما لا يكون العرض/الجدول موجودا. - [SPARK-46249] طلب تأمين المثيل للحصول على مقاييس RocksDB لمنع السباق مع عمليات الخلفية.
- [SPARK-46417] لا تفشل عند استدعاء hive.getTable و throwException خطأ.
- [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-46478] قم بإعادة SPARK-43049 لاستخدام oracle varchar(255) للسلسلة.
- [SPARK-46250] test_parity_listener deflake.
- [SPARK-46394] إصلاح مشكلات spark.catalog.listDatabases() على المخططات ذات الأحرف الخاصة عند
spark.sql.legacy.keepCommandOutputSchema
تعيينها إلى true. - [SPARK-46056] إصلاح NPE للقراءة المتجهة Parquet بالقيمة الافتراضية byteArrayDecimalType.
- [SPARK-46145] لا تطرح spark.catalog.listTables استثناء عند عدم العثور على الجدول أو طريقة العرض.
- [SPARK-46466] يجب ألا يقوم قارئ باركيه المتجه بإعادة قاعدة البيانات للطوابع الزمنية ntz.
- 14 ديسمبر 2023
- تم إصلاح مشكلة حيث تمت معالجة التسطير السفلي الهارب في عمليات getColumns التي تنشأ من عملاء JDBC أو ODBC بشكل غير صحيح وتفسيرها كأحرف بدل.
- [SPARK-45920] يجب أن تكون المجموعة حسب الترتيبية غير متكررة.
- [SPARK-44582] تخطي المكرر على SMJ إذا تم تنظيفه.
- [SPARK-45433] إصلاح استنتاج مخطط CSV/JSON عندما لا تتطابق الطوابع الزمنية مع تنسيق الطابع الزمني المحدد.
- [SPARK-45655] السماح بتعبيرات غير محددة داخل AggregateFunctions في CollectMetrics.
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - تمت ترقية موصل Spark-snowflake إلى 2.12.0.
- [SPARK-44846] تمت إزالة تعبيرات التجميع المعقدة بعد
RemoveRedundantAggregates
. - [SPARK-45544] دعم SSL المتكامل في
TransportContext
. - [SPARK-45892] التحقق من صحة خطة محسن إعادة بناء التعليمات البرمجية
validateSchemaOutput
لفصل وvalidateExprIdUniqueness
. - [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 10 نوفمبر 2023
- يتم دفع عوامل تصفية التقسيم على استعلامات تدفق Delta Lake لأسفل قبل تحديد المعدل لتحقيق استخدام أفضل.
- استعلامات موجز البيانات التي تم تغييرها في جداول دفق كتالوج Unity وطرق العرض المجسدة لعرض رسائل الخطأ.
- [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - [SPARK-45541] تمت إضافة
SSLFactory
. - [SPARK-45430]
FramelessOffsetWindowFunction
لم يعد يفشل عندماIGNORE NULLS
وoffset > rowCount
. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- [SPARK-44219] تمت إضافة عمليات تحقق إضافية لكل قاعدة لإعادة كتابة التحسين.
- [SPARK-45543] تم إصلاح مشكلة كانت تتسبب
InferWindowGroupLimit
في حدوث مشكلة إذا لم يكن لوظائف النافذة الأخرى نفس إطار النافذة مثل الدالات المماثلة للرتبة. - تحديثات أمان نظام التشغيل.
- 23 أكتوبر 2023
- [SPARK-45256] تم إصلاح مشكلة فشل عند
DurationWriter
كتابة قيم أكثر من السعة الأولية. - [SPARK-45419] تجنب إعادة استخدام الملفات
rocksdb sst
في مثيل مختلفrocksdb
عن طريق إزالة إدخالات مخطط إصدار الملف من الإصدارات الأكبر. - [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - إصلاحات متنوعة.
- [SPARK-45256] تم إصلاح مشكلة فشل عند
- 13 أكتوبر 2023
- تمت ترقية تبعية Snowflake-jdbc من 3.13.29 إلى 3.13.33.
- الدالة
array_insert
تستند إلى 1 للفهرسين الموجب والسالب، بينما كانت من قبل تستند إلى 0 للفهرس السالبة. يقوم الآن بإدراج عنصر جديد في نهاية صفائف الإدخال للفهرس -1. لاستعادة السلوك السابق، قم بتعيينspark.sql.legacy.negativeIndexInArrayInsert
إلىtrue
. - تم إصلاح مشكلة تتعلق بعدم تجاهل الملفات التالفة عند
ignoreCorruptFiles
تمكينها أثناء استنتاج مخطط CSV مع "المحمل التلقائي". - العودة [SPARK-42946].
- [SPARK-42205] حدث بروتوكول JSON لإزالة تسجيل Accumulables في مهمة أو أحداث بدء مرحلة.
- [SPARK-45178] الرجوع إلى تشغيل دفعة واحدة لمصادر
Trigger.AvailableNow
غير مدعومة بدلا من استخدام برنامج التضمين. - [SPARK-45316] إضافة معلمات
ignoreCorruptFiles
جديدة وignoreMissingFiles
إلىHadoopRDD
وNewHadoopRDD
. - [SPARK-44740] قيم بيانات التعريف الثابتة للبيانات الاصطناعية.
- [SPARK-45360] تكوين منشئ جلسة Spark الذي تمت تهيئته من
SPARK_REMOTE
. - [SPARK-44551] التعليقات المحررة للمزامنة مع OSS.
- [SPARK-45346] يحترم استنتاج مخطط Parquet الآن العلامات الحساسة لحالة الأحرف عند دمج المخطط.
- [SPARK-44658]
ShuffleStatus.getMapStatus
يتم الآن إرجاعNone
بدلا منSome(null)
. - [SPARK-44840] تم إنشاؤه
array_insert()
على أساس 1 للفهرس السالبة.
- 14 سبتمبر 2023
- [SPARK-44873] دعم إضافي للأعمدة
alter view
المتداخلة في عميل Apache Hive. - [SPARK-44878] تم إيقاف تشغيل الحد الصارم لمدير
RocksDB
الكتابة لتجنب استثناء الإدراج عند اكتمال ذاكرة التخزين المؤقت.
- [SPARK-44873] دعم إضافي للأعمدة
- 30 أغسطس 2023
- تم تحسين أمر dbutils
cp
(dbutils.fs.cp
) للنسخ بشكل أسرع. مع هذا التحسين، يمكن أن تستغرق عمليات النسخ ما يصل إلى 100 وقت أقل، اعتمادا على حجم الملف. تتوفر الميزة عبر جميع السحب وأنظمة الملفات التي يمكن الوصول إليها في Databricks، بما في ذلك وحدات تخزين كتالوج Unity وتركيبات DBFS. - [SPARK-44455] معرفات عرض الأسعار ذات الكواشف الخلفية في
SHOW CREATE TABLE
النتيجة. - [SPARK-44763] تم إصلاح مشكلة تظهر سلسلة كمضاعفة في الحساب الثنائي مع الفاصل الزمني.
- [SPARK-44871] السلوك الثابت
percentile_disc
. - [SPARK-44714] سهولة تقييد دقة LCA فيما يتعلق بالاستعلامات.
- [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
taskThread
. - [SPARK-44505] تمت إضافة تجاوز لدعم العمود في الفحص بحثا عن DSv2.
- [SPARK-44479] تم إصلاح تحويل protobuf من نوع بنية فارغ.
- [SPARK-44718] مطابقة
ColumnVector
التكوين الافتراضي لوضع الذاكرة معOffHeapMemoryMode
قيمة التكوين. - [SPARK-42941] دعم إضافي ل
StreamingQueryListener
في Python. - [SPARK-44558] تصدير مستوى سجل الاتصال Spark في PySpark.
- [SPARK-44464] تم إصلاحه
applyInPandasWithStatePythonRunner
لإخراج الصفوف التي تحتوي على Null كقيمة العمود الأول. - [SPARK-44643] يتم التصحيح
Row.__repr__
عندما يكون الحقل صفا فارغا. - تحديثات أمان نظام التشغيل.
- تم تحسين أمر dbutils
Databricks Runtime 12.2 LTS
راجع Databricks Runtime 12.2 LTS.
- 25 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 9 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 13 فبراير 2024
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- تحديثات أمان نظام التشغيل.
- 31 يناير 2024
- [SPARK-46763] إصلاح فشل التأكيد في ReplaceDeduplicateWithAggregate للسمات المكررة.
- تحديثات أمان نظام التشغيل.
- 25 ديسمبر 2023
- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-39440] إضافة تكوين لتعطيل المخطط الزمني للحدث.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- [SPARK-46394] إصلاح مشكلات spark.catalog.listDatabases() على المخططات ذات الأحرف الخاصة عند
spark.sql.legacy.keepCommandOutputSchema
تعيينها إلى true. - [SPARK-46417] لا تفشل عند استدعاء hive.getTable و throwException خطأ.
- [SPARK-43067] تصحيح موقع ملف مورد فئة الخطأ في موصل Kafka.
- [SPARK-46249] طلب تأمين المثيل للحصول على مقاييس RocksDB لمنع السباق مع عمليات الخلفية.
- [SPARK-46602] النشر
allowExisting
في إنشاء طريقة العرض عندما لا يكون العرض/الجدول موجودا. - [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-46145] لا تطرح spark.catalog.listTables استثناء عند عدم العثور على الجدول أو طريقة العرض.
- [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-42852] قم بإعادة التغييرات ذات الصلة المسماةLambdaVariable من EquivalentExpressions.
- 14 ديسمبر 2023
- تم إصلاح مشكلة حيث تمت معالجة التسطير السفلي الهارب في عمليات getColumns التي تنشأ من عملاء JDBC أو ODBC بشكل غير صحيح وتفسيرها كأحرف بدل.
- [SPARK-44582] تخطي المكرر على SMJ إذا تم تنظيفه.
- [SPARK-45920] يجب أن تكون المجموعة حسب الترتيبية غير متكررة.
- [SPARK-45655] السماح بتعبيرات غير محددة داخل AggregateFunctions في CollectMetrics.
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - تم إصلاح مشكلة حيث تم تفسير التسطير السفلي الهارب في
getColumns
العمليات التي تنشأ من عملاء JDBC أو ODBC بشكل خاطئ على أنها أحرف بدل. - [SPARK-42205] تمت إزالة مواصل التسجيل في
Stage
الأحداث وبدءهاTask
. - [SPARK-44846] تمت إزالة تعبيرات التجميع المعقدة بعد
RemoveRedundantAggregates
. - [SPARK-43718] تم إصلاح إمكانية القيم الخالية للمفاتيح في
USING
الصلات. - [SPARK-45544] دعم SSL المتكامل في
TransportContext
. - [SPARK-43973] تعرض واجهة مستخدم الدفق المنظم الآن الاستعلامات الفاشلة بشكل صحيح.
- [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 14 نوفمبر 2023
- يتم دفع عوامل تصفية التقسيم على استعلامات تدفق Delta Lake لأسفل قبل تحديد المعدل لتحقيق استخدام أفضل.
- [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - [SPARK-45541] تمت إضافة
SSLFactory
. - [SPARK-45430]
FramelessOffsetWindowFunction
لم يعد يفشل عندماIGNORE NULLS
وoffset > rowCount
. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- تحديثات أمان نظام التشغيل.
- 24 أكتوبر 2023
- [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - إصلاحات متنوعة.
- [SPARK-45426] دعم إضافي ل
- 13 أكتوبر 2023
- تمت ترقية تبعية Snowflake-jdbc من 3.13.29 إلى 3.13.33.
- [SPARK-42553] تأكد من وحدة زمنية واحدة على الأقل بعد الفاصل الزمني.
- [SPARK-45346] يحترم استنتاج مخطط Parquet العلامة الحساسة لحالة الأحرف عند دمج المخطط.
- [SPARK-45178] الرجوع إلى تشغيل دفعة واحدة لمصادر
Trigger.AvailableNow
غير مدعومة بدلا من استخدام برنامج التضمين. - [SPARK-45084]
StateOperatorProgress
لاستخدام رقم قسم عشوائي دقيق وملائم.
- 12 سبتمبر 2023
- [SPARK-44873] تمت إضافة دعم للأعمدة
alter view
المتداخلة في عميل Apache Hive. - [SPARK-44718] مطابقة
ColumnVector
التكوين الافتراضي لوضع الذاكرة معOffHeapMemoryMode
قيمة التكوين. - [SPARK-43799] تمت إضافة خيار ثنائي واصف إلى واجهة برمجة تطبيقات PySpark
Protobuf
. - إصلاحات متنوعة.
- [SPARK-44873] تمت إضافة دعم للأعمدة
- 30 أغسطس 2023
- [SPARK-44485] محسن
TreeNode.generateTreeString
. - [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
taskThread
. - [11.3-13.0] [[SPARK-44871]]https://issues.apache.org/jira/browse/SPARK-44871) السلوك الثابت
percentile_disc
. - [SPARK-44714] تخفيف تقييد دقة LCA فيما يتعلق بالاستعلامات.
- تحديثات أمان نظام التشغيل.
- [SPARK-44485] محسن
- 15 أغسطس 2023
- [SPARK-44504] تقوم مهمة الصيانة بتنظيف الموفرين المحملين عند خطأ الإيقاف.
- [SPARK-44464] تم إصلاحه
applyInPandasWithStatePythonRunner
لإخراج الصفوف التي تحتويNull
على قيمة العمود الأول. - تحديثات أمان نظام التشغيل.
- 29 يوليو 2023
- تم إصلاح مشكلة إرجاع
dbutils.fs.ls()
عند استدعاؤهاINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
لمسار موقع تخزين تصادم مع موقع تخزين خارجي أو مدار آخر. - [SPARK-44199]
CacheManager
لم يعد يتم تحديث دونfileIndex
داع. - تحديثات أمان نظام التشغيل.
- تم إصلاح مشكلة إرجاع
- 24 يوليو 2023
- [SPARK-44337] تم إصلاح مشكلة حيث تسبب أي حقل تم تعيينه في
Any.getDefaultInstance
حدوث أخطاء تحليل. - [SPARK-44136] تم إصلاح مشكلة حيث
StateManager
يتم تحقيق ذلك في منفذ بدلا من برنامج التشغيل فيFlatMapGroupsWithStateExec
. - تحديثات أمان نظام التشغيل.
- [SPARK-44337] تم إصلاح مشكلة حيث تسبب أي حقل تم تعيينه في
- 23 يونيو 2023
- تحديثات أمان نظام التشغيل.
- 15 يونيو 2023
- الفوتونات
approx_count_distinct
. - تمت ترقية مكتبة Snowflake-jdbc إلى 3.13.29 لمعالجة مشكلة أمنية.
- [SPARK-43779]
ParseToDate
يتم تحميل الآنEvalMode
في مؤشر الترابط الرئيسي. - [SPARK-43156][SPARK-43098] اختبار خطأ عدد الاستعلامات الفرعية العددية الموسعة مع
decorrelateInnerQuery
إيقاف التشغيل. - تحديثات أمان نظام التشغيل.
- الفوتونات
- 2 يونيو 2023
- يقوم محلل JSON في
failOnUnknownFields
الوضع بإسقاط سجل فيDROPMALFORMED
الوضع ويفشل مباشرة فيFAILFAST
الوضع. - تحسين أداء التحديثات المتزايدة باستخدام
SHALLOW CLONE
Iceberg وParquet. - تم إصلاح مشكلة في "المحمل التلقائي" حيث كانت تنسيقات الملفات المصدر المختلفة غير متناسقة عندما لا يتضمن المخطط المتوفر أقساما مستنتجة. قد تتسبب هذه المشكلة في فشل غير متوقع عند قراءة الملفات ذات الأعمدة المفقودة في مخطط القسم المستنتج.
- [SPARK-43404] تخطي إعادة استخدام الملف sst لنفس الإصدار من مخزن حالة RocksDB لتجنب خطأ عدم تطابق المعرف.
- [SPARK-43413][11.3-13.0] قابلية خالية الاستعلام
ListQuery
الفرعي الثابتIN
. - [SPARK-43522] تم إصلاح إنشاء اسم عمود البنية باستخدام فهرس الصفيف.
- [SPARK-43541] نشر كافة
Project
العلامات في حل التعبيرات والأعمدة المفقودة. - [SPARK-43527] تم التصحيح
catalog.listCatalogs
في PySpark. - [SPARK-43123] لم تعد بيانات تعريف الحقل الداخلية تسرب إلى الكتالوجات.
- [SPARK-43340] تم إصلاح حقل تتبع المكدس المفقود في سجلات الأحداث.
- [SPARK-42444]
DataFrame.drop
يعالج الآن الأعمدة المكررة بشكل صحيح. - [SPARK-42937]
PlanSubqueries
يتم الآن تعيينInSubqueryExec#shouldBroadcast
إلى true. - [SPARK-43286] تم تحديث
aes_encrypt
وضع CBC لإنشاء IVs عشوائية. - [SPARK-43378] أغلق كائنات الدفق بشكل صحيح في
deserializeFromChunkedBuffer
.
- يقوم محلل JSON في
- 17 مايو 2023
- أصبحت عمليات فحص Parquet قوية الآن مقابل OOMs عند مسح الملفات ذات البنية الاستثنائية عن طريق ضبط حجم الدفعة ديناميكيا. يتم تحليل بيانات تعريف الملف لتقليل حجم الدفعة بشكل استباقي ويتم خفضها مرة أخرى في إعادة محاولة المهمة كشبكة أمان نهائية.
- إذا تمت قراءة ملف Avro باستخدام الخيار فقط
failOnUnknownFields\
أو مع "المحمل التلقائي" فيfailOnNewColumns\
وضع تطور المخطط، فستتم قراءة الأعمدة التي تحتوي على أنواع بيانات مختلفة بدلاnull\
من طرح خطأ يفيد بأنه لا يمكن قراءة الملف. تفشل هذه القراءات الآن وتوصي المستخدمين باستخدامrescuedDataColumn\
الخيار . - يقوم التحميل التلقائي الآن بما يلي.
-
- يقرأ و و و
Byte
بشكل صحيح، و لن يتم إنقاذهInteger
Short
بشكل صحيح إذا تم توفير أحد أنواع البيانات هذه، ولكن ملف Avro يقترح أحد النوعين الآخرين.
- يقرأ و و و
-
- يمنع أنواع الفواصل الزمنية للقراءة كنوع من الطوابع الزمنية أو التاريخ لتجنب الحصول على تواريخ تالفة.
-
- يمنع أنواع القراءة
Decimal
بدقة أقل.
- يمنع أنواع القراءة
- [SPARK-43172] يعرض المضيف والرمز المميز من عميل اتصال Spark.
- [SPARK-43293]
__qualified_access_only
يتم تجاهلها في الأعمدة العادية. - [SPARK-43098] خطأ تصحيح
COUNT
ثابت عند تجميع الاستعلام الفرعي العددي حسب عبارة . - [SPARK-43085] دعم تعيين العمود
DEFAULT
لأسماء الجداول متعددة الأجزاء. - [SPARK-43190]
ListQuery.childOutput
متناسق الآن مع الإخراج الثانوي. - [SPARK-43192] تمت إزالة التحقق من صحة مجموعة عوامل المستخدم.
- تحديثات أمان نظام التشغيل.
- 25 أبريل 2023
- إذا تمت قراءة ملف Parquet مع الخيار فقط
failOnUnknownFields
أو مع أداة التحميل التلقائي فيfailOnNewColumns
وضع تطور المخطط، فستتم قراءة الأعمدة التي تحتوي على أنواع بيانات مختلفة بدلاnull
من طرح خطأ يفيد بأنه لا يمكن قراءة الملف. تفشل هذه القراءات الآن وتوصي المستخدمين باستخدامrescuedDataColumn
الخيار . - يقوم أداة التحميل التلقائي الآن بقراءة أنواع و بشكل صحيح ولم يعد يقوم بإنقاذها
Integer
Short
Byte
إذا تم توفير أحد أنواع البيانات هذه. يقترح ملف Parquet أحد النوعين الآخرين. عند تمكين عمود البيانات الذي تم إنقاذه مسبقا، قد يؤدي عدم تطابق نوع البيانات إلى حفظ الأعمدة على الرغم من أنها قابلة للقراءة. - [SPARK-43009] ذات
sql()
معلمات معAny
ثوابت - [SPARK-42406] إنهاء الحقول المتكررة Protobuf عن طريق إسقاط الحقل
- [SPARK-43038] دعم وضع CBC بواسطة
aes_encrypt()
/aes_decrypt()
- [SPARK-42971] تغيير للطباعة
workdir
إذا كانappDirs
فارغا عند معالجة العامل للحدثWorkDirCleanup
- [SPARK-43018] إصلاح الخطأ لأوامر INSERT باستخدام القيم الحرفية للطوابع الزمنية
- تحديثات أمان نظام التشغيل.
- إذا تمت قراءة ملف Parquet مع الخيار فقط
- 11 أبريل 2023
- دعم تنسيقات مصدر البيانات القديمة في
SYNC
الأمر . - إصلاح مشكلة في سلوك ٪autoreload في دفاتر الملاحظات خارج المستودع.
- تم إصلاح مشكلة حيث يمكن أن ينتقل تطور مخطط التحميل التلقائي إلى حلقة فشل لا نهائية عند اكتشاف عمود جديد في مخطط كائن JSON متداخل.
- [SPARK-42928] يجعل
resolvePersistentFunction
المزامنة. - [SPARK-42936] إصلاح مشكلة LCan عندما يمكن حل العبارة مباشرة بواسطة التجميع التابع لها.
- [SPARK-42967]
SparkListenerTaskStart.stageAttemptId
إصلاحات عند بدء مهمة بعد إلغاء المرحلة. - تحديثات أمان نظام التشغيل.
- دعم تنسيقات مصدر البيانات القديمة في
- 29 مارس 2023
يدعم Databricks SQL الآن تحديد القيم الافتراضية لأعمدة جداول Delta Lake، إما في وقت إنشاء الجدول أو بعد ذلك. يمكن أن تشير الأوامر اللاحقة و
MERGE
إلى القيمة الافتراضية لأي عمود باستخدام الكلمة الأساسية الصريحةDEFAULT
.INSERT
UPDATE
DELETE
بالإضافة إلى ذلك، إذا كان أيINSERT
تعيين يحتوي على قائمة صريحة من أعمدة أقل من الجدول الهدف، فسيتم استبدال القيم الافتراضية المقابلة للعمود بالأعمدة المتبقية (أو NULL إذا لم يتم تحديد افتراضي).على سبيل المثال:
CREATE TABLE t (first INT, second DATE DEFAULT CURRENT_DATE()) USING delta; INSERT INTO t VALUES (0, DEFAULT); INSERT INTO t VALUES (1, DEFAULT); SELECT first, second FROM t; \> 0, 2023-03-28 1, 2023-03-28z
يبدأ برنامج التحميل التلقائي الآن تنظيف سجل RocksDB متزامن واحد على الأقل للتدفقات
Trigger.AvailableNow
للتحقق من إمكانية تنظيف نقطة التحقق بانتظام لتدفقات التحميل التلقائي سريعة التشغيل. قد يتسبب هذا في أن تستغرق بعض التدفقات وقتا أطول قبل إيقاف تشغيلها، ولكنها ستوفر لك تكاليف التخزين وتحسن تجربة التحميل التلقائي في عمليات التشغيل المستقبلية.يمكنك الآن تعديل جدول Delta لإضافة دعم إلى ميزات الجدول باستخدام
DeltaTable.addFeatureSupport(feature_name)
.[SPARK-42794] قم بزيادة lockAcquireTimeoutMs إلى دقيقتين للحصول على مخزن حالة RocksDB في Structure Streaming
[SPARK-42521] إضافة NULLs ل INSERTs مع قوائم محددة من قبل المستخدم من أعمدة أقل من الجدول الهدف
[SPARK-42702][SPARK-42623] دعم الاستعلام ذات المعلمات في الاستعلام الفرعي وCTE
[SPARK-42668] التقاط استثناء أثناء محاولة إغلاق الدفق المضغوط في إيقاف HDFSStateStoreProvider
[SPARK-42403] يجب أن يتعامل JsonProtocol مع سلاسل JSON الخالية
- 8 مارس 2023
- تم تحسين رسالة الخطأ "فشل تهيئة التكوين" لتوفير المزيد من السياق للعميل.
- هناك تغيير في المصطلحات لإضافة ميزات إلى جدول Delta باستخدام خاصية الجدول. بناء الجملة المفضل الآن
'delta.feature.featureName'='supported'
بدلا من'delta.feature.featureName'='enabled'
. للتوافق مع الإصدارات السابقة، لا يزال استخدام'delta.feature.featureName'='enabled'
يعمل وسيستمر في العمل. - بدءا من هذا الإصدار، من الممكن إنشاء/استبدال جدول بخاصية
delta.ignoreProtocolDefaults
جدول إضافية لتجاهل تكوينات Spark المتعلقة بالبروتوكول، والتي تتضمن إصدارات القارئ والكاتب الافتراضية وميزات الجدول المدعومة افتراضيا. - [SPARK-42070] تغيير القيمة الافتراضية لوسيطة الدالة Mask من -1 إلى NULL
- [SPARK-41793] نتيجة غير صحيحة لإطارات النوافذ المعرفة بواسطة عبارة نطاق على الأرقام العشرية الهامة
- [SPARK-42484] رسالة خطأ أفضل ل UnsafeRowUtils
- [SPARK-42516] التقاط تكوين المنطقة الزمنية لجلسة العمل دائما أثناء إنشاء طرق العرض
- [SPARK-42635] إصلاح تعبير TimestampAdd.
- [SPARK-42622] إيقاف تشغيل الاستبدال في القيم
- [SPARK-42534] إصلاح عبارة DB2Dialect Limit
- [SPARK-42121] إضافة دوال قيم الجدول المضمنة posexplode posexplode_outer json_tuple والمكدس
- [SPARK-42045] وضع ANSI SQL: يجب أن ترجع Round/Bround خطأ في تجاوز عدد صحيح صغير/صغير/كبير
- تحديثات أمان نظام التشغيل.
Databricks Runtime 11.3 LTS
راجع Databricks Runtime 11.3 LTS.
- 25 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 9 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 13 فبراير 2024
- [SPARK-46794] إزالة الاستعلامات الفرعية من قيود LogicalRDD.
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- تحديثات أمان نظام التشغيل.
- 31 يناير 2024
- تحديثات أمان نظام التشغيل.
- 25 ديسمبر 2023
- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-46602] النشر
allowExisting
في إنشاء طريقة العرض عندما لا يكون العرض/الجدول موجودا. - [SPARK-46394] إصلاح مشكلات spark.catalog.listDatabases() على المخططات ذات الأحرف الخاصة عند
spark.sql.legacy.keepCommandOutputSchema
تعيينها إلى true. - [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-39440] إضافة تكوين لتعطيل المخطط الزمني للحدث.
- [SPARK-46249] طلب تأمين المثيل للحصول على مقاييس RocksDB لمنع السباق مع عمليات الخلفية.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- 14 ديسمبر 2023
- تم إصلاح مشكلة حيث تمت معالجة التسطير السفلي الهارب في عمليات getColumns التي تنشأ من عملاء JDBC أو ODBC بشكل غير صحيح وتفسيرها كأحرف بدل.
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - تم إصلاح مشكلة حيث تم تفسير التسطير السفلي الهارب في
getColumns
العمليات التي تنشأ من عملاء JDBC أو ODBC بشكل خاطئ على أنها أحرف بدل. - [SPARK-43973] تعرض واجهة مستخدم الدفق المنظم الآن الاستعلامات الفاشلة بشكل صحيح.
- [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-45544] دعم SSL المتكامل في
TransportContext
. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - [SPARK-43718] تم إصلاح إمكانية القيم الخالية للمفاتيح في
USING
الصلات. - [SPARK-44846] تمت إزالة تعبيرات التجميع المعقدة بعد
RemoveRedundantAggregates
. - تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 14 نوفمبر 2023
- يتم دفع عوامل تصفية التقسيم على استعلامات تدفق Delta Lake لأسفل قبل تحديد المعدل لتحقيق استخدام أفضل.
- [SPARK-42205] تمت إزالة مواصل التسجيل في أحداث بدء المرحلة والمهمة.
- [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - إرجاع [SPARK-33861].
- [SPARK-45541] تمت إضافة
SSLFactory
. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - [SPARK-45430]
FramelessOffsetWindowFunction
لم يعد يفشل عندماIGNORE NULLS
وoffset > rowCount
. - [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - تحديثات أمان نظام التشغيل.
- 24 أكتوبر 2023
- [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - إصلاحات متنوعة.
- [SPARK-45426] دعم إضافي ل
- 13 أكتوبر 2023
- تمت ترقية تبعية Snowflake-jdbc من 3.13.29 إلى 3.13.33.
- [SPARK-45178] الرجوع إلى تشغيل دفعة واحدة لمصادر
Trigger.AvailableNow
غير مدعومة بدلا من استخدام برنامج التضمين. - [SPARK-45084]
StateOperatorProgress
لاستخدام رقم قسم عشوائي دقيق وملائم. - [SPARK-45346] يحترم استنتاج مخطط Parquet الآن العلامة الحساسة لحالة الأحرف عند دمج مخطط.
- تحديثات أمان نظام التشغيل.
- 10 سبتمبر 2023
- إصلاحات متنوعة.
- 30 أغسطس 2023
- [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
taskThread
. - [SPARK-44871][11.3-13.0] السلوك الثابت
percentile_disc
. - تحديثات أمان نظام التشغيل.
- [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
- 15 أغسطس 2023
- [SPARK-44485] محسن
TreeNode.generateTreeString
. - [SPARK-44504] تقوم مهمة الصيانة بتنظيف الموفرين المحملين عند خطأ الإيقاف.
- [SPARK-44464] تم إصلاحه
applyInPandasWithStatePythonRunner
لإخراج الصفوف التي تحتويNull
على قيمة العمود الأول. - تحديثات أمان نظام التشغيل.
- [SPARK-44485] محسن
- 27 يوليو 2023
- تم إصلاح مشكلة إرجاع
dbutils.fs.ls()
عند استدعاؤهاINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
لمسار موقع تخزين تصادم مع موقع تخزين خارجي أو مدار آخر. - [SPARK-44199]
CacheManager
لم يعد يتم تحديث دونfileIndex
داع. - تحديثات أمان نظام التشغيل.
- تم إصلاح مشكلة إرجاع
- 24 يوليو 2023
- [SPARK-44136] تم إصلاح مشكلة يمكن أن تتحقق فيها StateManager في المنفذ بدلا من برنامج التشغيل في FlatMapGroupsWithStateExec.
- تحديثات أمان نظام التشغيل.
- 23 يونيو 2023
- تحديثات أمان نظام التشغيل.
- 15 يونيو 2023
- الفوتونات
approx_count_distinct
. - تمت ترقية مكتبة Snowflake-jdbc إلى 3.13.29 لمعالجة مشكلة أمنية.
- [SPARK-43779]
ParseToDate
يتم تحميل الآنEvalMode
في مؤشر الترابط الرئيسي. - [SPARK-40862] دعم الاستعلامات الفرعية غير المجمعة في RewriteCorrelatedScalarSubquery
- [SPARK-43156][SPARK-43098] اختبار خطأ عدد الاستعلامات الفرعية العددية الموسعة مع
decorrelateInnerQuery
إيقاف التشغيل. - [SPARK-43098] إصلاح خطأ عدد التصحيحات عندما يحتوي الاستعلام الفرعي العددي على عبارة تجميع حسب
- تحديثات أمان نظام التشغيل.
- الفوتونات
- 2 يونيو 2023
- يقوم محلل JSON في
failOnUnknownFields
الوضع بإسقاط سجل فيDROPMALFORMED
الوضع ويفشل مباشرة فيFAILFAST
الوضع. - تحسين أداء التحديثات المتزايدة باستخدام
SHALLOW CLONE
Iceberg وParquet. - تم إصلاح مشكلة في "المحمل التلقائي" حيث كانت تنسيقات الملفات المصدر المختلفة غير متناسقة عندما لا يتضمن المخطط المتوفر أقساما مستنتجة. قد تتسبب هذه المشكلة في فشل غير متوقع عند قراءة الملفات ذات الأعمدة المفقودة في مخطط القسم المستنتج.
- [SPARK-43404]تخطي إعادة استخدام الملف sst لنفس الإصدار من مخزن حالة RocksDB لتجنب خطأ عدم تطابق المعرف.
- [SPARK-43527] تم التصحيح
catalog.listCatalogs
في PySpark. - [SPARK-43413][11.3-13.0] قابلية خالية الاستعلام
ListQuery
الفرعي الثابتIN
. - [SPARK-43340] تم إصلاح حقل تتبع المكدس المفقود في سجلات الأحداث.
- يقوم محلل JSON في
Databricks Runtime 10.4 LTS
راجع Databricks Runtime 10.4 LTS.
- 25 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 6 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 13 فبراير 2024
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- تحديثات أمان نظام التشغيل.
- 31 يناير 2024
- تحديثات أمان نظام التشغيل.
- 25 ديسمبر 2023
- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-46538] إصلاح مشكلة مرجع العمود الغامض في
ALSModel.transform
. - [SPARK-39440] إضافة تكوين لتعطيل المخطط الزمني للحدث.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- 14 ديسمبر 2023
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - [SPARK-45544] دعم SSL المتكامل في
TransportContext
. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - [SPARK-43718] تم إصلاح إمكانية القيم الخالية للمفاتيح في
USING
الصلات. - [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - [SPARK-42205] تمت إزالة مواصل التسجيل في أحداث بدء المرحلة والمهمة.
- [SPARK-44846] تمت إزالة تعبيرات التجميع المعقدة بعد
RemoveRedundantAggregates
. - تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 14 نوفمبر 2023
- [SPARK-45541] تمت إضافة
SSLFactory
. - [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - إرجاع [SPARK-33861].
- تحديثات أمان نظام التشغيل.
- [SPARK-45541] تمت إضافة
- 24 أكتوبر 2023
- [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - تحديثات أمان نظام التشغيل.
- [SPARK-45426] دعم إضافي ل
- 13 أكتوبر 2023
- [SPARK-45084]
StateOperatorProgress
لاستخدام رقم قسم عشوائي دقيق وملائم. - [SPARK-45178] الرجوع إلى تشغيل دفعة واحدة لمصادر
Trigger.AvailableNow
غير مدعومة بدلا من استخدام برنامج التضمين. - تحديثات أمان نظام التشغيل.
- [SPARK-45084]
- 10 سبتمبر 2023
- إصلاحات متنوعة.
- 30 أغسطس 2023
- [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
taskThread
. - تحديثات أمان نظام التشغيل.
- [SPARK-44818] تم تهيئة تعارض ثابت لمقاطعة المهمة المعلقة التي تم إصدارها قبل
- 15 أغسطس 2023
- [SPARK-44504] تقوم مهمة الصيانة بتنظيف الموفرين المحملين عند خطأ الإيقاف.
- [SPARK-43973] تظهر واجهة مستخدم الدفق المنظم الآن الاستعلامات الفاشلة بشكل صحيح.
- تحديثات أمان نظام التشغيل.
- 23 يونيو 2023
- تحديثات أمان نظام التشغيل.
- 15 يونيو 2023
- تمت ترقية مكتبة Snowflake-jdbc إلى 3.13.29 لمعالجة مشكلة أمنية.
- [SPARK-43098] إصلاح خطأ عدد التصحيحات عندما يحتوي الاستعلام الفرعي العددي على عبارة تجميع حسب
- [SPARK-40862] دعم الاستعلامات الفرعية غير المجمعة في RewriteCorrelatedScalarSubquery
- [SPARK-43156][SPARK-43098] اختبار عدد الاستعلامات الفرعية العددية الموسعة مع
decorrelateInnerQuery
إيقاف التشغيل. - تحديثات أمان نظام التشغيل.
- 2 يونيو 2023
- يقوم محلل JSON في
failOnUnknownFields
الوضع بإسقاط سجل فيDROPMALFORMED
الوضع ويفشل مباشرة فيFAILFAST
الوضع. - تم إصلاح مشكلة في تحليل البيانات التي تم إنقاذها من JSON لمنع
UnknownFieldException
. - تم إصلاح مشكلة في "المحمل التلقائي" حيث كانت تنسيقات الملفات المصدر المختلفة غير متناسقة عندما لا يتضمن المخطط المتوفر أقساما مستنتجة. قد تتسبب هذه المشكلة في فشل غير متوقع عند قراءة الملفات ذات الأعمدة المفقودة في مخطط القسم المستنتج.
- [SPARK-43404] تخطي إعادة استخدام الملف sst لنفس الإصدار من مخزن حالة RocksDB لتجنب خطأ عدم تطابق المعرف.
- [SPARK-43413] قابلية خالية الاستعلام
ListQuery
الفرعي الثابتIN
. - تحديثات أمان نظام التشغيل.
- يقوم محلل JSON في
- 17 مايو 2023
- أصبحت عمليات فحص Parquet قوية الآن مقابل OOMs عند مسح الملفات ذات البنية الاستثنائية عن طريق ضبط حجم الدفعة ديناميكيا. يتم تحليل بيانات تعريف الملف لتقليل حجم الدفعة بشكل استباقي ويتم خفضها مرة أخرى في إعادة محاولة المهمة كشبكة أمان نهائية.
- [SPARK-41520] تقسيم
AND_OR
نمط الشجرة لفصلAND
وOR
. - [SPARK-43190]
ListQuery.childOutput
متناسق الآن مع الإخراج الثانوي. - تحديثات أمان نظام التشغيل.
- 25 أبريل 2023
- [SPARK-42928] إجراء
resolvePersistentFunction
المزامنة. - تحديثات أمان نظام التشغيل.
- [SPARK-42928] إجراء
- 11 أبريل 2023
- تم إصلاح مشكلة حيث يمكن أن ينتقل تطور مخطط التحميل التلقائي إلى حلقة فشل لا نهائية عند اكتشاف عمود جديد في مخطط كائن JSON متداخل.
- [SPARK-42937]
PlanSubqueries
يتم الآن تعيينInSubqueryExec#shouldBroadcast
إلى true. - [SPARK-42967] إصلاح SparkListenerTaskStart.stageAttemptId عند بدء مهمة بعد إلغاء المرحلة.
- 29 مارس 2023
- [SPARK-42668] التقاط استثناء أثناء محاولة إغلاق الدفق المضغوط في إيقاف HDFSStateStoreProvider
- [SPARK-42635] إصلاح ...
- تحديثات أمان نظام التشغيل.
- 14 مارس 2023
- [SPARK-41162] إصلاح الصلة المضادة وشبه المنضمة ذاتيا باستخدام التجميعات
- [SPARK-33206] إصلاح حساب وزن ذاكرة التخزين المؤقت للفهرس العشوائي لملفات الفهرس الصغيرة
- [SPARK-42484]
UnsafeRowUtils
تحسين رسالة الخطأ - إصلاحات متنوعة.
- 28 فبراير 2023
- دعم العمود الذي تم إنشاؤه ل yyyy-MM-dd date_format. يدعم هذا التغيير تقسيم القسم ل yyyy-MM-dd ك date_format في الأعمدة التي تم إنشاؤها.
- يمكن للمستخدمين الآن قراءة وكتابة جداول Delta محددة تتطلب الإصدار 3 من Reader والإصدار 7 من Writer، باستخدام Databricks Runtime 9.1 LTS أو أحدث. للنجاح، يجب دعم ميزات الجدول المدرجة في بروتوكول الجداول بواسطة الإصدار الحالي من Databricks Runtime.
- دعم العمود الذي تم إنشاؤه ل yyyy-MM-dd date_format. يدعم هذا التغيير تقسيم القسم ل yyyy-MM-dd ك date_format في الأعمدة التي تم إنشاؤها.
- تحديثات أمان نظام التشغيل.
- 16 فبراير 2023
- [SPARK-30220] تمكين استخدام الاستعلامات الفرعية Exists/In خارج عقدة عامل التصفية
- تحديثات أمان نظام التشغيل.
- 31 يناير 2023
- أنواع جداول JDBC أصبحت الآن خارجية بشكل افتراضي.
- 18 يناير 2023
- يقوم موصل Azure Synapse بإرجاع رسالة خطأ وصفية أكثر عندما يحتوي اسم العمود على أحرف غير صالحة مثل المسافات البيضاء أو الفواصل المنقوشة. في مثل هذه الحالات، سيتم إرجاع الرسالة التالية:
Azure Synapse Analytics failed to run the JDBC query produced by the connector. Check column names do not include not valid characters such as ';' or white space
. - [SPARK-38277] مسح دفعة الكتابة بعد تثبيت مخزن حالة RocksDB
- [SPARK-41199] إصلاح مشكلة المقاييس عند استخدام مصدر دفق DSv1 ومصدر دفق DSv2 المشترك
- [SPARK-41198] إصلاح المقاييس في استعلام البث الذي لديه مصدر دفق CTE وDSv1.
- [SPARK-41339] إغلاق وإعادة إنشاء دفعة كتابة RocksDB بدلا من مجرد مسح.
- [SPARK-41732] تطبيق التقليم المستند إلى نمط الشجرة للقاعدة SessionWindowing.
- تحديثات أمان نظام التشغيل.
- يقوم موصل Azure Synapse بإرجاع رسالة خطأ وصفية أكثر عندما يحتوي اسم العمود على أحرف غير صالحة مثل المسافات البيضاء أو الفواصل المنقوشة. في مثل هذه الحالات، سيتم إرجاع الرسالة التالية:
- 29 نوفمبر 2022
- يمكن للمستخدمين تكوين سلوك المسافات البيضاء البادئة واللاحقة عند كتابة البيانات باستخدام موصل Redshift. تمت إضافة الخيارات التالية للتحكم في معالجة المساحة البيضاء:
csvignoreleadingwhitespace
، عند التعيين إلىtrue
، يزيل المسافة البيضاء البادئة من القيم أثناء عمليات الكتابة عندtempformat
تعيين إلىCSV
أوCSV GZIP
. يتم الاحتفاظ بالمسافات البيضاء عند تعيين التكوين إلىfalse
. بشكل افتراضي، القيمة هيtrue
.csvignoretrailingwhitespace
، عند التعيين إلىtrue
، يزيل المسافة البيضاء اللاحقة من القيم أثناء عمليات الكتابة عندtempformat
تعيين إلىCSV
أوCSV GZIP
. يتم الاحتفاظ بالمسافات البيضاء عند تعيين التكوين إلىfalse
. بشكل افتراضي، القيمة هيtrue
.
- تم إصلاح مشكلة في تحليل JSON في "المحمل التلقائي" عند ترك كافة الأعمدة كسلاسل (
cloudFiles.inferColumnTypes
لم يتم تعيينها أو تعيينها إلىfalse
) وتحتوي JSON على كائنات متداخلة. - تحديثات أمان نظام التشغيل.
- يمكن للمستخدمين تكوين سلوك المسافات البيضاء البادئة واللاحقة عند كتابة البيانات باستخدام موصل Redshift. تمت إضافة الخيارات التالية للتحكم في معالجة المساحة البيضاء:
- 15 نوفمبر 2022
- تمت ترقية نص Apache commons إلى 1.10.0.
- [SPARK-40646] تم إصلاح تحليل JSON للبنى والخرائط والصفائف حتى عندما لا يتطابق جزء من السجل مع المخطط، فلا يزال من الممكن تحليل باقي السجل بشكل صحيح بدلا من إرجاع القيم الخالية. للاشتراك في السلوك المحسن، قم بتعيين
spark.sql.json.enablePartialResults
إلىtrue
. يتم إيقاف تشغيل العلامة بشكل افتراضي للحفاظ على السلوك الأصلي. - [SPARK-40292] إصلاح أسماء الأعمدة في
arrays_zip
الدالة عند الإشارة إلى الصفائف من البنيات المتداخلة - تحديثات أمان نظام التشغيل.
- 1 نوفمبر 2022
- تم إصلاح مشكلة حيث إذا كان جدول Delta يحتوي على عمود معرف من قبل المستخدم باسم
_change_type
، ولكن تم إيقاف تشغيل موجز بيانات التغيير على هذا الجدول، فستملأ البيانات الموجودة في هذا العمود قيم NULL بشكل غير صحيح عند تشغيلMERGE
. - تم إصلاح مشكلة في "المحمل التلقائي" حيث يمكن تكرار ملف في نفس الدفعة الصغيرة عند
allowOverwrites
تمكين - [SPARK-40697] إضافة ترك مساحة للأحرف من جانب القراءة لتغطية ملفات البيانات الخارجية
- [SPARK-40596] ملء ExecutorDecommission بالرسائل في ExecutorDecommissionInfo
- تحديثات أمان نظام التشغيل.
- تم إصلاح مشكلة حيث إذا كان جدول Delta يحتوي على عمود معرف من قبل المستخدم باسم
- 18 أكتوبر 2022
- تحديثات أمان نظام التشغيل.
- 5 أكتوبر 2022
- [SPARK-40468] إصلاح تشذيب العمود في CSV عند
_corrupt_record
تحديده. - تحديثات أمان نظام التشغيل.
- [SPARK-40468] إصلاح تشذيب العمود في CSV عند
- 22 سبتمبر 2022
- يمكن للمستخدمين تعيين spark.conf.set(
spark.databricks.io.listKeysWithPrefix.azure.enabled
,true
) لإعادة تمكين القائمة المضمنة للتحميل التلقائي على ADLS Gen2. تم إيقاف تشغيل القائمة المضمنة مسبقا بسبب مشكلات في الأداء ولكن يمكن أن تؤدي إلى زيادة تكاليف التخزين للعملاء. - [SPARK-40315] إضافة hashCode() ل Literal of ArrayBasedMapData
- [SPARK-40213] دعم تحويل قيمة ASCII للأحرف اللاتينية 1
- [SPARK-40380] إصلاح الطي المستمر ل InvokeLike لتجنب القيم الحرفية غير القابلة للتسلسل المضمنة في الخطة
- [SPARK-38404] تحسين دقة CTE عندما يشير CTE متداخل إلى CTE خارجي
- [SPARK-40089] إصلاح الفرز لبعض الأنواع العشرية
- [SPARK-39887] يجب أن تحتفظ RemoveRedundantAliases بأسماء مستعارة تجعل إخراج عقد الإسقاط فريدا
- يمكن للمستخدمين تعيين spark.conf.set(
- 6 سبتمبر 2022
- [SPARK-40235] استخدم التأمين القابل للمقاطعة بدلا من المزامنة في Executor.updateDependencies().
- [SPARK-40218] يجب أن تحتفظ GROUPING SETS بأعمدة التجميع.
- [SPARK-39976] يجب أن يتعامل ArrayIntersect مع القيمة الخالية في التعبير الأيسر بشكل صحيح.
- [SPARK-40053] أضف
assume
إلى حالات الإلغاء الديناميكية التي تتطلب بيئة وقت تشغيل Python. - [SPARK-35542] إصلاح: لا يمكن تحميل Bucketizer الذي تم إنشاؤه لأعمدة متعددة مع المعلمات splitsArray وinputCols وoutputCols بعد حفظه.
- [SPARK-40079] إضافة التحقق من صحة Imputer inputCols لحالة الإدخال الفارغة.
- 24 أغسطس 2022
- [SPARK-39983] لا تقم بتخزين علاقات البث غير المتسلسلة مؤقتا على برنامج التشغيل.
- [SPARK-39775] تعطيل التحقق من صحة القيم الافتراضية عند تحليل مخططات Avro.
- [SPARK-39962] تطبيق الإسقاط عندما تكون سمات المجموعة فارغة
- [SPARK-37643] عندما يكون charVarcharAsString صحيحا، يجب أن يتخطى استعلام دالة تقييم نوع بيانات char قاعدة rpadding.
- تحديثات أمان نظام التشغيل.
- 9 أغسطس 2022
- [SPARK-39847] إصلاح حالة التعارض في RocksDBLoader.loadLibrary() إذا تمت مقاطعة مؤشر ترابط المتصل
- [SPARK-39731] إصلاح المشكلة في مصادر بيانات CSV وJSON عند تحليل التواريخ بتنسيق "yyyyMMdd" باستخدام نهج محلل الوقت المصحح
- تحديثات أمان نظام التشغيل.
- 27 يوليو 2022
- [SPARK-39625] إضافة Dataset.as(StructType).
- [SPARK-39689]دعم حرفين
lineSep
في مصدر بيانات CSV. - [SPARK-39104] InMemoryRelation#isCachedColumnBuffersLoaded يجب أن يكون مؤشر ترابط آمنا.
- [SPARK-39570] يجب أن يسمح الجدول المضمن بتعبيرات بالاسم المستعار.
- [SPARK-39702] تقليل حمل الذاكرة ل TransportCipher$EncryptedMessage باستخدام byteRawChannel مشترك.
- [SPARK-39575] إضافة ByteBuffer#rewind بعد ByteBuffer#get in AvroDeserializer.
- [SPARK-39476] تعطيل تحسين تحويل Unwrap عند التحويل من Long إلى Float/ Double أو من Integer إلى Float.
- [SPARK-38868] لا تنشر استثناءات من دالة تقييم التصفية عند تحسين الصلات الخارجية.
- تحديثات أمان نظام التشغيل.
- 20 يوليو 2022
- اجعل نتائج عملية Delta MERGE متسقة عندما يكون المصدر غير محدد.
- [SPARK-39355] يستخدم عمود واحد مقتبس لإنشاء قاعدة بيانات غير محلولة.
- [SPARK-39548] الأمر CreateView مع استعلام عبارة نافذة اضغط على تعريف نافذة غير صحيح لم يتم العثور على مشكلة.
- [SPARK-39419] إصلاح ArraySort لطرح استثناء عندما يرجع المقارن قيمة خالية.
- إيقاف تشغيل استخدام Loader التلقائي لواجهات برمجة التطبيقات السحابية المضمنة لقائمة الدليل على Azure.
- تحديثات أمان نظام التشغيل.
- 5 يوليو 2022
- [SPARK-39376] إخفاء الأعمدة المكررة في توسيع نجمي للاسم المستعار للسعلام الفرعي من NATURAL/USING JOIN
- تحديثات أمان نظام التشغيل.
- 15 يونيو 2022
- [SPARK-39283] إصلاح حالة التوقف التام بين TaskMemoryManager وSableExternalSorter.SpillableIterator.
- [SPARK-39285] يجب ألا يتحقق Spark من أسماء الحقول عند قراءة الملفات.
- [SPARK-34096] تحسين الأداء nth_value تجاهل القيم الخالية عبر نافذة الإزاحة.
- [SPARK-36718]
isExtractOnly
إصلاح التحقق في طي المشروع.
- 2 يونيو 2022
- [SPARK-39093] تجنب خطأ التحويل البرمجي ل codegen عند قسمة الفواصل الزمنية للشهر أو الفواصل الزمنية لليوم على جزء لا يتجزأ.
- [SPARK-38990] تجنب NullPointerException عند تقييم تنسيق date_trunc/الاقتطاع كمرجع منضم.
- تحديثات أمان نظام التشغيل.
- 18 مايو 2022
- إصلاح تسرب محتمل للذاكرة المضمنة في "المحمل التلقائي".
- [SPARK-38918] يجب أن يقوم تشذيب العمود المتداخل بتصفية السمات التي لا تنتمي إلى العلاقة الحالية.
- [SPARK-37593] قم بتقليل حجم الصفحة الافتراضية حسب LONG_ARRAY_OFFSET إذا تم استخدام G1GC و ON_HEAP.
- [SPARK-39084] إصلاح df.rdd.isEmpty() باستخدام TaskContext لإيقاف المكرر عند إكمال المهمة.
- [SPARK-32268] إضافة ColumnPruning في injectBloomFilter.
- [SPARK-38974] تصفية الدالات المسجلة باسم قاعدة بيانات معين في دالات القائمة.
- [SPARK-38931] إنشاء دليل dfs الجذر ل RocksDBFileManager مع عدد غير معروف من المفاتيح على نقطة التحقق 1.
- تحديثات أمان نظام التشغيل.
- 19 أبريل 2022
- تمت ترقية Java AWS SDK من الإصدار 1.11.655 إلى 1.12.1899.
- تم إصلاح مشكلة في المكتبات ذات نطاق دفتر الملاحظات التي لا تعمل في مهام دفق الدفعات.
- [SPARK-38616] تعقب نص استعلام SQL في Catalyst TreeNode
- تحديثات أمان نظام التشغيل.
- 6 أبريل 2022
- تتوفر الآن دوال Spark SQL التالية مع هذا الإصدار:
timestampadd()
وdateadd()
: إضافة مدة زمنية في وحدة محددة إلى تعبير طابع زمني.timestampdiff()
وdatediff()
: حساب الفرق الزمني بين تعبيرات الطابع الزمني في وحدة محددة.
- تم ترقية Parquet-MR إلى 1.12.2
- دعم محسن للمخططات الشاملة في ملفات parquet
- [SPARK-38631] يستخدم التنفيذ المستند إلى Java لإلغاء التصويب في Utils.unpack.
- [SPARK-38509][SPARK-38481] Cherry-pick ثلاثة
timestmapadd/diff
تغييرات. - [SPARK-38523] إصلاح الإشارة إلى عمود السجل التالف من CSV.
- [SPARK-38237] السماح
ClusteredDistribution
لطلب مفاتيح التجميع الكاملة. - [SPARK-38437] تسلسل متساهل للتاريخ والوقت من مصدر البيانات.
- [SPARK-38180] السماح بتعبيرات آمنة في دالات تقييم المساواة المترابطة.
- [SPARK-38155] عدم السماح بتجميع مميز في الاستعلامات الفرعية الجانبية مع دالات تقييم غير معتمدة.
- تحديثات أمان نظام التشغيل.
- تتوفر الآن دوال Spark SQL التالية مع هذا الإصدار:
Databricks Runtime 9.1 LTS
راجع Databricks Runtime 9.1 LTS.
- 25 أبريل 2024
- إصلاحات الأخطاء المتنوعة.
- 9 أبريل 2024
- تحديثات أمان نظام التشغيل.
- 13 فبراير 2024
- [SPARK-46861] تجنب حالة التوقف التام في DAGScheduler.
- تحديثات أمان نظام التشغيل.
- 31 يناير 2024
- تحديثات أمان نظام التشغيل.
- 25 ديسمبر 2023
- لتجنب زيادة زمن الانتقال عند الاتصال عبر TLSv1.3، يتضمن إصدار الصيانة هذا تصحيحا لتثبيت JDK 8 لإصلاح خطأ JDK JDK-8293562.
- [SPARK-46058] إضافة علامة منفصلة ل privateKeyPassword.
- [SPARK-39440] إضافة تكوين لتعطيل المخطط الزمني للحدث.
- [SPARK-46132] دعم كلمة مرور المفتاح لمفاتيح JKS ل RPC SSL.
- 14 ديسمبر 2023
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2023
- تثبيت حزمة جديدة،
pyarrow-hotfix
لمعالجة ثغرة أمنية في PyArrow RCE. - [SPARK-45859] كائنات UDF التي تم إنشاؤها كسولة
ml.functions
. - [SPARK-45544] دعم SSL المتكامل في
TransportContext
. - [SPARK-45730] قيود الوقت المحسنة ل
ReloadingX509TrustManagerSuite
. - تحديثات أمان نظام التشغيل.
- تثبيت حزمة جديدة،
- 14 نوفمبر 2023
- [SPARK-45545]
SparkTransportConf
يرثSSLOptions
عند الإنشاء. - [SPARK-45429] تمت إضافة فئات المساعد لاتصال SSL RPC.
- [SPARK-45427] تمت إضافة إعدادات RPC SSL إلى
SSLOptions
وSparkTransportConf
. - [SPARK-45584] فشل تشغيل الاستعلام الفرعي الثابت باستخدام
TakeOrderedAndProjectExec
. - [SPARK-45541] تمت إضافة
SSLFactory
. - [SPARK-42205] تمت إزالة مواصل التسجيل في أحداث بدء المرحلة والمهمة.
- تحديثات أمان نظام التشغيل.
- [SPARK-45545]
- 24 أكتوبر 2023
- [SPARK-45426] دعم إضافي ل
ReloadingX509TrustManager
. - تحديثات أمان نظام التشغيل.
- [SPARK-45426] دعم إضافي ل
- 13 أكتوبر 2023
- تحديثات أمان نظام التشغيل.
- 10 سبتمبر 2023
- إصلاحات متنوعة.
- 30 أغسطس 2023
- تحديثات أمان نظام التشغيل.
- 15 أغسطس 2023
- تحديثات أمان نظام التشغيل.
- 23 يونيو 2023
- تمت ترقية مكتبة Snowflake-jdbc إلى 3.13.29 لمعالجة مشكلة أمنية.
- تحديثات أمان نظام التشغيل.
- 15 يونيو 2023
- [SPARK-43098] إصلاح خطأ عدد التصحيحات عندما يحتوي الاستعلام الفرعي العددي على عبارة مجموعة حسب.
- [SPARK-43156][SPARK-43098] توسيع اختبار خطأ عدد الاستعلامات الفرعية العددي مع
decorrelateInnerQuery
إيقاف التشغيل. - [SPARK-40862] دعم الاستعلامات الفرعية غير المجمعة في RewriteCorrelatedScalarSubquery.
- تحديثات أمان نظام التشغيل.
- 2 يونيو 2023
- يقوم محلل JSON في
failOnUnknownFields
الوضع بإسقاط سجل فيDROPMALFORMED
الوضع ويفشل مباشرة فيFAILFAST
الوضع. - تم إصلاح مشكلة في تحليل البيانات التي تم إنقاذها من JSON لمنع
UnknownFieldException
. - تم إصلاح مشكلة في "المحمل التلقائي" حيث كانت تنسيقات الملفات المصدر المختلفة غير متناسقة عندما لا يتضمن المخطط المتوفر أقساما مستنتجة. قد تتسبب هذه المشكلة في فشل غير متوقع عند قراءة الملفات ذات الأعمدة المفقودة في مخطط القسم المستنتج.
- [SPARK-37520] إضافة دالات
startswith()
السلسلة وendswith()
- [SPARK-43413] قابلية خالية الاستعلام
ListQuery
الفرعي الثابتIN
. - تحديثات أمان نظام التشغيل.
- يقوم محلل JSON في
- 17 مايو 2023
- تحديثات أمان نظام التشغيل.
- 25 أبريل 2023
- تحديثات أمان نظام التشغيل.
- 11 أبريل 2023
- تم إصلاح مشكلة حيث يمكن أن ينتقل تطور مخطط التحميل التلقائي إلى حلقة فشل لا نهائية عند اكتشاف عمود جديد في مخطط كائن JSON متداخل.
- [SPARK-42967] إصلاح SparkListenerTaskStart.stageAttemptId عند بدء مهمة بعد إلغاء المرحلة.
- 29 مارس 2023
- تحديثات أمان نظام التشغيل.
- 14 مارس 2023
- [SPARK-42484] رسالة خطأ محسنة ل
UnsafeRowUtils
. - إصلاحات متنوعة.
- [SPARK-42484] رسالة خطأ محسنة ل
- 28 فبراير 2023
- يمكن للمستخدمين الآن قراءة وكتابة جداول Delta محددة تتطلب الإصدار 3 من Reader والإصدار 7 من Writer، باستخدام Databricks Runtime 9.1 LTS أو أحدث. للنجاح، يجب دعم ميزات الجدول المدرجة في بروتوكول الجداول بواسطة الإصدار الحالي من Databricks Runtime.
- تحديثات أمان نظام التشغيل.
- 16 فبراير 2023
- تحديثات أمان نظام التشغيل.
- 31 يناير 2023
- أنواع جداول JDBC أصبحت الآن خارجية بشكل افتراضي.
- 18 يناير 2023
- تحديثات أمان نظام التشغيل.
- 29 نوفمبر 2022
- تم إصلاح مشكلة في تحليل JSON في "المحمل التلقائي" عند ترك كافة الأعمدة كسلاسل (
cloudFiles.inferColumnTypes
لم يتم تعيينها أو تعيينها إلىfalse
) وتحتوي JSON على كائنات متداخلة. - تحديثات أمان نظام التشغيل.
- تم إصلاح مشكلة في تحليل JSON في "المحمل التلقائي" عند ترك كافة الأعمدة كسلاسل (
- 15 نوفمبر 2022
- تمت ترقية نص Apache commons إلى 1.10.0.
- تحديثات أمان نظام التشغيل.
- إصلاحات متنوعة.
- 1 نوفمبر 2022
- تم إصلاح مشكلة حيث إذا كان جدول Delta يحتوي على عمود معرف من قبل المستخدم باسم
_change_type
، ولكن تم إيقاف تشغيل موجز بيانات التغيير على هذا الجدول، فستملأ البيانات الموجودة في هذا العمود قيم NULL بشكل غير صحيح عند تشغيلMERGE
. - تم إصلاح مشكلة في "المحمل التلقائي" حيث يمكن تكرار ملف في نفس الدفعة الصغيرة عند
allowOverwrites
تمكين - [SPARK-40596] ملء ExecutorDecommission بالرسائل في ExecutorDecommissionInfo
- تحديثات أمان نظام التشغيل.
- تم إصلاح مشكلة حيث إذا كان جدول Delta يحتوي على عمود معرف من قبل المستخدم باسم
- 18 أكتوبر 2022
- تحديثات أمان نظام التشغيل.
- 5 أكتوبر 2022
- إصلاحات متنوعة.
- تحديثات أمان نظام التشغيل.
- 22 سبتمبر 2022
- يمكن للمستخدمين تعيين spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") لإعادة تمكين القائمة المضمنة للتحميل التلقائي على ADLS Gen2. تم إيقاف تشغيل القائمة المضمنة مسبقا بسبب مشكلات في الأداء ولكن يمكن أن تؤدي إلى زيادة تكاليف التخزين للعملاء.
- [SPARK-40315] إضافة hashCode() ل Literal of ArrayBasedMapData
- [SPARK-40089] إصلاح الفرز لبعض الأنواع العشرية
- [SPARK-39887] يجب أن تحتفظ RemoveRedundantAliases بأسماء مستعارة تجعل إخراج عقد الإسقاط فريدا
- 6 سبتمبر 2022
- [SPARK-40235] استخدام التأمين القابل للمقاطعة بدلا من المزامنة في Executor.updateDependencies()
- [SPARK-35542] إصلاح: لا يمكن تحميل Bucketizer الذي تم إنشاؤه لأعمدة متعددة باستخدام المعلمات splitsArray وinputCols وoutputCols بعد حفظه
- [SPARK-40079] إضافة التحقق من صحة Imputer inputCols لحالة الإدخال الفارغة
- 24 أغسطس 2022
- [SPARK-39666] استخدام UnsafeProjection.create لالاحترام
spark.sql.codegen.factoryMode
في ExpressionEncoder - [SPARK-39962] تطبيق الإسقاط عندما تكون سمات المجموعة فارغة
- تحديثات أمان نظام التشغيل.
- [SPARK-39666] استخدام UnsafeProjection.create لالاحترام
- 9 أغسطس 2022
- تحديثات أمان نظام التشغيل.
- 27 يوليو 2022
- اجعل نتائج عملية Delta MERGE متسقة عندما يكون المصدر غير محدد.
- [SPARK-39689] دعم حرفين
lineSep
في مصدر بيانات CSV - [SPARK-39575] تمت الإضافة
ByteBuffer#rewind
بعدByteBuffer#get
فيAvroDeserializer
. - [SPARK-37392] تم إصلاح خطأ الأداء لمحسن المحفز.
- تحديثات أمان نظام التشغيل.
- 13 يوليو 2022
- [SPARK-39419]
ArraySort
يطرح استثناء عندما يقوم المقارن بإرجاع قيمة خالية. - إيقاف تشغيل استخدام Loader التلقائي لواجهات برمجة التطبيقات السحابية المضمنة لقائمة الدليل على Azure.
- تحديثات أمان نظام التشغيل.
- [SPARK-39419]
- 5 يوليو 2022
- تحديثات أمان نظام التشغيل.
- إصلاحات متنوعة.
- 15 يونيو 2022
- [SPARK-39283] إصلاح حالة التوقف التام بين
TaskMemoryManager
وUnsafeExternalSorter.SpillableIterator
.
- [SPARK-39283] إصلاح حالة التوقف التام بين
- 2 يونيو 2022
- [SPARK-34554]
copy()
تنفيذ الأسلوب فيColumnarMap
. - تحديثات أمان نظام التشغيل.
- [SPARK-34554]
- 18 مايو 2022
- تم إصلاح تسرب محتمل للذاكرة المضمنة في "المحمل التلقائي".
- ترقية إصدار AWS SDK من 1.11.655 إلى 1.11.678.
- [SPARK-38918] يجب أن يؤدي تشذيب الأعمدة المتداخلة إلى تصفية السمات التي لا تنتمي إلى العلاقة الحالية
- [SPARK-39084] الإصلاح
df.rdd.isEmpty()
باستخدامTaskContext
لإيقاف المكرر عند إكمال المهمة - تحديثات أمان نظام التشغيل.
- 19 أبريل 2022
- تحديثات أمان نظام التشغيل.
- إصلاحات متنوعة.
- 6 أبريل 2022
- [SPARK-38631] يستخدم التنفيذ المستند إلى Java لإلغاء التصويب في Utils.unpack.
- تحديثات أمان نظام التشغيل.
- 22 مارس 2022
- تغيير دليل العمل الحالي لدفاتر الملاحظات على مجموعات التزامن العالي مع تمكين التحكم في الوصول إلى الجدول أو تمرير بيانات الاعتماد إلى الدليل الرئيسي للمستخدم. في السابق، كان
/databricks/driver
الدليل النشط . - [SPARK-38437] تسلسل متساهل للتاريخ والوقت من مصدر البيانات
- [SPARK-38180] السماح بتعبيرات آمنة في دالات تقييم المساواة المترابطة
- [SPARK-38155] عدم السماح بتجميع مميز في الاستعلامات الفرعية الجانبية مع دالات تقييم غير معتمدة
- [SPARK-27442] تمت إزالة حقل فحص عند قراءة البيانات أو كتابتها في parquet.
- تغيير دليل العمل الحالي لدفاتر الملاحظات على مجموعات التزامن العالي مع تمكين التحكم في الوصول إلى الجدول أو تمرير بيانات الاعتماد إلى الدليل الرئيسي للمستخدم. في السابق، كان
- 14 مارس 2022
- [SPARK-38236] يتم التعامل مع مسارات الملفات المطلقة المحددة في جدول الإنشاء/التغيير على أنها نسبية
- [SPARK-34069] مقاطعة مؤشر ترابط المهمة إذا تم تعيين الخاصية
SPARK_JOB_INTERRUPT_ON_CANCEL
المحلية إلى true.
- 23 فبراير 2022
- [SPARK-37859] جداول SQL التي تم إنشاؤها باستخدام JDBC مع Spark 3.1 غير قابلة للقراءة باستخدام Spark 3.2.
- 8 فبراير 2022
- [SPARK-27442] تمت إزالة حقل فحص عند قراءة البيانات أو كتابتها في parquet.
- تحديثات أمان نظام التشغيل.
- 1 فبراير 2022
- تحديثات أمان نظام التشغيل.
- 26 يناير 2022
- تم إصلاح مشكلة حيث يمكن تثبيت المعاملات المتزامنة على جداول Delta بترتيب غير قابل للتسلسل في ظل ظروف نادرة معينة.
- تم إصلاح مشكلة حيث
OPTIMIZE
قد يفشل الأمر عند تمكين لهجة ANSI SQL.
- 19 يناير 2022
- إصلاحات طفيفة وتحسينات أمنية.
- تحديثات أمان نظام التشغيل.
- 4 نوفمبر 2021
- تم إصلاح مشكلة قد تتسبب في فشل تدفقات الدفق المنظم باستخدام
ArrayIndexOutOfBoundsException
. - تم إصلاح حالة تعارض قد تتسبب في فشل استعلام باستخدام IOException مثل
java.io.IOException: No FileSystem for scheme
أو قد يتسبب في عدم سريان التعديلاتsparkContext.hadoopConfiguration
في الاستعلامات. - تمت ترقية الاتصال Apache Spark لمشاركة دلتا إلى 0.2.0.
- تم إصلاح مشكلة قد تتسبب في فشل تدفقات الدفق المنظم باستخدام
- 20 أكتوبر 2021
- تمت ترقية موصل BigQuery من 0.18.1 إلى 0.22.2. يضيف هذا دعما لنوع BigNumeric.
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ