Rekayasa data Databricks

Fitur rekayasa data Databricks adalah lingkungan yang kuat untuk kolaborasi antara ilmuwan data, insinyur data, dan analis data. Tugas rekayasa data juga merupakan tulang punggung solusi pembelajaran mesin Databricks.

Catatan

Jika Anda adalah analis data yang bekerja terutama dengan kueri SQL dan alat BI, Anda mungkin lebih suka Databricks SQL.

Nama Gunakan ini ketika Anda ingin...
Tabel Delta Live Pelajari cara membuat alur data untuk penyerapan dan transformasi dengan Databricks Delta Live Tables.
Streaming Terstruktur Pelajari tentang beban kerja streaming, inkremental, dan real-time yang didukung oleh Streaming Terstruktur di Databricks.
Apache Spark Pelajari cara kerja Apache Spark di Databricks dan platform Databricks.
Notebooks Pelajari apa itu buku catatan Databricks, dan cara menggunakan dan mengelola buku catatan untuk memproses, menganalisis, dan memvisualisasikan data Anda.
Alur kerja Pelajari cara mengatur alur kerja pemrosesan data, pembelajaran mesin, dan analisis data pada platform Databricks.
Perpustakaan Pelajari cara membuat kode pihak ketiga atau kustom tersedia di Databricks menggunakan pustaka. Pelajari tentang berbagai mode untuk menginstal pustaka di Databricks.
Folder Git Pelajari cara menggunakan Git untuk mengontrol versi buku catatan Anda dan file lain untuk pengembangan di Databricks.
DBFS Pelajari tentang Databricks File System (DBFS), sistem file terdistribusi yang dipasang ke ruang kerja Databricks dan tersedia di kluster Databricks
File Pelajari tentang opsi untuk bekerja dengan file di Databricks.
Migration Pelajari cara memigrasikan aplikasi data seperti pekerjaan ETL, gudang data perusahaan, ML, ilmu data, dan analitik ke Databricks.
Pengoptimalan & performa Pelajari tentang pengoptimalan dan rekomendasi performa di Databricks.