Gambaran umum komputasi standar

Halaman ini menyediakan gambaran umum komputasi standar.

Apa itu komputasi standar?

Komputasi standar adalah komputasi yang dikonfigurasi dengan mode akses standar. Sumber daya komputasi standar dapat digunakan oleh setiap pengguna yang diberikan izin untuk melakukannya.

Komputasi standar direkomendasikan untuk sebagian besar beban kerja. Komputasi standar memungkinkan sejumlah pengguna untuk melampirkan dan menjalankan beban kerja secara bersamaan pada sumber daya komputasi yang sama, memberikan penghematan biaya dan manajemen komputasi yang disederhanakan. Komputasi standar menjalankan kode pengguna dalam isolasi penuh tanpa akses ke sumber daya tingkat bawah.

Pemilihan mode akses

Mode akses dikonfigurasi saat membuat sumber daya komputasi semua tujuan atau pekerjaan. Pengaturan mode akses berada di bawah bagian Tingkat Lanjut di UI komputasi dan diwakili oleh data_security_mode dalam API.

Secara default di UI, mode akses diatur ke Otomatis, yang berarti mode akses secara otomatis dipilih untuk Anda berdasarkan Databricks Runtime yang Anda pilih. Otomatis default ke Standar kecuali runtime pembelajaran mesin atau Runtime Databricks yang lebih rendah dari 14.3 dipilih, dalam hal ini Dedicated digunakan.

Kapan menggunakan komputasi standar

Komputasi standar direkomendasikan untuk sebagian besar beban kerja, termasuk:

  • Rekayasa data umum dan alur ETL: Sebagian besar beban kerja pemrosesan data
  • Proyek ilmu data kolaboratif: Teams bekerja sama dalam analisis dan pengembangan model
  • Eksplorasi data interaktif: Analisis ad-hoc dan pengembangan berbasis buku catatan
  • Pengoptimalan biaya: Saat Anda ingin berbagi sumber daya komputasi di beberapa pengguna

Pilih komputasi khusus hanya untuk beban kerja khusus yang memerlukan akses komputer istimewa, API RDD, ML terdistribusi, GPU, atau R. Untuk daftar batasan komputasi standar, lihat Persyaratan dan batasan komputasi standar.

Dukungan bahasa dan runtime

Komputasi standar memiliki dukungan bahasa pemrograman berikut:

  • Python: Dukungan penuh untuk semua versi Runtime Databricks
  • SQL: Dukungan penuh untuk semua versi Databricks Runtime
  • Scala: Didukung pada Databricks Runtime 13.3 LTS ke atas dengan Unity Catalog
  • R: Tidak didukung pada komputasi standar

Lakeguard untuk isolasi pengguna

Komputasi standar menggunakan Azure Databricks Lakeguard untuk menyediakan isolasi pengguna dan tata kelola data yang aman. Lakeguard menggunakan teknik isolasi kode lanjutan yang memisahkan kode pengguna dari infrastruktur Spark yang mendasar.

Untuk informasi selengkapnya, lihat Bagaimana Databricks memberlakukan isolasi pengguna?.