Lembar contekan penjadwalan pekerjaan produksi

Artikel ini bertujuan untuk memberikan panduan yang jelas dan berpendapat untuk penjadwalan pekerjaan produksi. Menggunakan praktik terbaik dapat membantu mengurangi biaya, meningkatkan performa, dan memperketat keamanan.

Praktik Terbaik	Dampak	Dokumen
Menggunakan komputasi tanpa server untuk pekerjaan	Biaya: Pekerjaan tanpa server tidak memerlukan konfigurasi kluster. Azure Databricks mengelola provisi dan penskalakan secara otomatis.	Menjalankan pekerjaan tanpa server
Gunakan Tugas Lakeflow untuk orkestrasi jika memungkinkan	Cost: Tidak perlu menggunakan alat eksternal untuk mengorkestrasi jika Anda hanya mengorkestrasi beban kerja pada Azure Databricks.	Pekerjaan Lakeflow
Gunakan entitas layanan sebagai pengganti akun pengguna untuk menjalankan pekerjaan produksi	Keamanan: Jika pekerjaan dimiliki oleh pengguna individual, ketika pengguna tersebut meninggalkan organisasi, pekerjaan ini mungkin berhenti berjalan.	Prinsipal layanan
Untuk komputasi klasik: gunakan kluster pekerjaan untuk alur kerja otomatis	Biaya: Kluster pekerjaan ditagih dengan tarif yang lebih rendah daripada kluster interaktif.	Membuat kluster Kluster semua tujuan dan pekerjaan.
Untuk komputasi klasik: mulai ulang kluster yang berjalan lama	Keamanan: Mulai ulang kluster untuk memanfaatkan patch dan perbaikan bug ke Databricks Runtime.	Mulai ulang kluster untuk memperbaruinya dengan gambar terbaru
Untuk komputasi klasik: gunakan Versi LTS terbaru dari Databricks Runtime	Performance dan biaya: Azure Databricks selalu meningkatkan Databricks Runtime untuk kegunaan, performa, dan keamanan.	Menghitung Siklus hidup dukungan Databricks
Untuk komputasi klasik: jangan simpan data produksi di Akar DBFS	Keamanan: Saat data disimpan di akar DBFS, semua pengguna dapat mengaksesnya.	Apa itu DBFS? Rekomendasi untuk bekerja dengan Akar DBFS

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-11