Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini bertujuan untuk memberikan panduan yang jelas dan berorientasi untuk pembuatan sistem komputasi. Dengan menggunakan jenis komputasi yang tepat untuk alur kerja Anda, Anda dapat meningkatkan performa dan menghemat biaya.
| Praktik Terbaik | Dampak | Dokumen |
|---|---|---|
| Menggunakan komputasi tanpa server untuk sebagian besar beban kerja | Azure Databricks mengelola ukuran, penskalaan, dan infrastruktur secara otomatis. Tidak diperlukan konfigurasi kluster. | |
| Untuk komputasi klasik: gunakan mode akses standar kecuali fungsionalitas yang diperlukan tidak didukung | Komputasi dengan mode akses standar dapat digunakan oleh beberapa pengguna dengan isolasi data di antara pengguna. | |
| Untuk komputasi klasik: mulailah dengan menggunakan jenis instans ber tujuan umum jika Anda baru mengenal Azure Databricks | Memilih jenis instans yang sesuai untuk beban kerja menghasilkan efisiensi yang lebih tinggi. | |
| Untuk komputasi klasik: gunakan jenis instans generasi terbaru jika ada ketersediaan yang cukup | Jenis instans generasi terbaru memberikan performa terbaik dan fitur terbaru. |
|
| Untuk komputasi klasik: atur saldo sesuai permintaan dan instans spot Anda berdasarkan seberapa cepat Anda memerlukan beban kerja Anda untuk dijalankan | Instans spot menghemat biaya tetapi dapat memengaruhi durasi keseluruhan operasi jika instans spot diklaim kembali. | |
| Untuk komputasi klasik: pilih ukuran simpul Anda dan jumlah pekerja berdasarkan jenis operasi yang dilakukan beban kerja Anda | Misalnya, jika Anda mengharapkan banyak pengacakan, bisa lebih efisien menggunakan node yang besar alih-alih beberapa node yang lebih kecil. | |
| Untuk komputasi klasik: jalankan vakum pada kluster dengan penskalaan otomatis yang ditetapkan untuk 1-4 pekerja, di mana setiap pekerja memiliki 8 core. Pilih driver dengan antara 8 dan 32 core. Tingkatkan ukuran driver jika Anda mendapatkan kesalahan kehabisan memori (OOM). |
Pernyataan vakum terjadi dalam dua fase, yang kedua sangat bergantung pada pengemudi. Jika Anda tidak menggunakan kluster berukuran tepat, operasi dapat menyebabkan perlambatan dan mungkin tidak berhasil. | |
| Untuk komputasi klasik: menilai apakah alur kerja batch Anda akan mendapat manfaat dari Photon | Photon menyediakan kueri yang lebih cepat dan mengurangi total biaya per beban kerja Anda. |