Batasan dengan Databricks Connect untuk Python
Catatan
Artikel ini membahas Databricks Connect untuk Databricks Runtime 13.3 LTS ke atas.
Artikel ini mencantumkan batasan dengan Databricks Connect untuk Python. Databricks Connect memungkinkan Anda menyambungkan ID Populer, server buku catatan, dan aplikasi kustom ke kluster Azure Databricks. Lihat Apa itu Databricks Connect?. Untuk versi Scala artikel ini, lihat Batasan dengan Databricks Connect untuk Scala.
Tidak tersedia di Databricks Connect untuk Databricks Runtime 13.3 LTS dan di bawah ini:
- Streaming
foreachBatch
- Membuat DataFrame yang lebih besar dari 128 MB
- Kueri panjang lebih dari 3600 detik
Tidak tersedia:
- API himpunan data
- API jenis himpunan data (seperti
reduce()
danflatMap()
) - Utilitas Databricks:
credentials
, ,library
,notebook workflow
widgets
SparkContext
RDDs
- Inferensi model MLflow:
pyfunc.spark_udf()
API - Geospasial mosaik
CREATE TABLE <table-name> AS SELECT
(sebagai gantinya, gunakanspark.sql("SELECT ...").write.saveAsTable("table")
)ApplyinPandas()
danCogroup()
dengan kluster bersama- Mengubah tingkat log log4j melalui
SparkContext
- Pelatihan ML terdistribusi
- Menyinkronkan lingkungan pengembangan lokal dengan kluster jarak jauh