Bagikan melalui


Jenis gudang SQL

Databricks SQL mendukung jenis gudang SQL berikut:

  • Tanpa server
  • Pro
  • Klasik

Setiap jenis gudang SQL memiliki kemampuan performa yang berbeda. Tabel berikut ini memperlihatkan fitur performa yang didukung oleh setiap jenis gudang SQL.

Jenis gudang Mesin Foton IO prediktif Manajemen Beban Kerja Cerdas
Tanpa server X X X
Pro X X
Klasik X

Daftar berikut ini menjelaskan setiap fitur performa:

  • Foton: Mesin kueri vektor asli pada Databricks. Ini membuat panggilan SQL dan DataFrame API yang ada lebih cepat dan mengurangi total biaya per beban kerja Anda.

  • IO Prediktif: Serangkaian fitur untuk mempercepat operasi pemindaian selektif dalam kueri SQL. IO prediktif dapat menyediakan berbagai speedup.

  • Manajemen beban kerja cerdas (IWM): Serangkaian fitur yang meningkatkan kemampuan Databricks SQL Serverless untuk memproses sejumlah besar kueri dengan cepat dan hemat biaya. Dengan menggunakan prediksi yang didukung AI dan teknik manajemen dinamis, IWM bekerja untuk memastikan bahwa beban kerja memiliki jumlah sumber daya yang tepat dengan cepat. Perbedaan utama terletak pada kemampuan AI di Databricks SQL untuk merespons tuntutan beban kerja secara dinamis daripada menggunakan ambang statis.

    Catatan

    Untuk harga untuk setiap jenis gudang dan perbandingan fitur terperinci, lihat Databricks SQL. Untuk mempelajari fitur Databricks SQL terbaru, lihat Catatan rilis Databricks SQL.

Perbedaan performa antara jenis gudang SQL

Setiap jenis gudang SQL memiliki karakteristik performa yang berbeda.

Gudang SQL tanpa server

Menggunakan arsitektur tanpa server Azure Databricks, gudang SQL tanpa server mendukung semua fitur performa Databricks SQL. Dengan gudang SQL tanpa server dan fitur performanya, Anda mendapatkan:

  • Waktu mulai cepat (biasanya antara 2 dan 6 detik).
  • Peningkatan skala yang cepat untuk memperoleh lebih banyak komputasi ketika diperlukan untuk mempertahankan latensi rendah.
  • Pengakuan kueri lebih dekat ke batasan perangkat keras daripada komputer virtual.
  • Penurunan skala cepat untuk meminimalkan biaya ketika permintaan rendah, memberikan performa yang konsisten dengan biaya dan sumber daya yang dioptimalkan.

Untuk performa startup terbaik, IO yang paling efisien, penanganan permintaan kueri yang lebih cerdas yang sangat bervariasi dari waktu ke waktu, dan penskalaan otomatis yang cepat saat antrean kueri terjadi, pilih gudang SQL tanpa server. Lihat Penskalakan otomatis tanpa server dan antrean kueri.

Gudang SQL tanpa server berkinerja baik dengan jenis beban kerja ini:

  • ETL
  • Inteligensi bisnis
  • Analisis eksploratif

Penting

Gudang SQL tidak mendukung passthrough kredensial. Databricks merekomendasikan penggunaan Unity Catalog untuk tata kelola data. Lihat Apakah itu Katalog Unity?.

Gudang Pro SQL

Gudang pro SQL mendukung Photon dan Predictive IO, tetapi tidak mendukung Intelligent Workload Management. Dengan gudang SQL pro (tidak seperti gudang SQL tanpa server), lapisan komputasi ada di Anda adalah akun langganan Azure Anda daripada di akun Azure Databricks Anda. Akibatnya, gudang pro SQL tidak mendukung Manajemen Beban Kerja Cerdas, membuatnya kurang responsif terhadap permintaan kueri yang sangat bervariasi dari waktu ke waktu dan tidak dapat menskalakan otomatis secepat gudang SQL tanpa server. Gudang pro SQL membutuhkan waktu beberapa menit untuk memulai (biasanya sekitar 4 menit) dan meningkatkan dan menurunkan skala dengan lebih sedikit responsivitas daripada gudang SQL tanpa server. Lihat Antrean dan penskalaan otomatis untuk gudang SQL pro dan klasik.

Gunakan gudang pro SQL saat:

  • Gudang SQL tanpa server tidak tersedia di suatu wilayah.
  • Anda memiliki jaringan yang ditentukan khusus dan ingin menyambungkan ke database di jaringan Anda di cloud atau lokal untuk federasi atau arsitektur jenis hibrid. Misalnya, gunakan gudang SQL pro jika Anda ingin memasukkan layanan lain ke jaringan Anda seperti bus peristiwa atau database, atau Anda ingin menyambungkan jaringan Anda ke jaringan lokal Anda.

Gudang SQL klasik

Gudang SQL klasik mendukung Photon, tetapi tidak mendukung IO Prediktif atau Manajemen Beban Kerja Cerdas. Dengan gudang SQL klasik (tidak seperti gudang SQL tanpa server), lapisan komputasi ada di akun langganan Azure Anda daripada di akun Azure Databricks Anda. Tanpa dukungan untuk IO Prediktif atau Manajemen Beban Kerja Cerdas, gudang SQL klasik hanya memberikan performa tingkat pemula dan performa yang lebih sedikit daripada gudang SQL tanpa server atau pro. Gudang SQL klasik juga membutuhkan waktu beberapa menit untuk memulai (biasanya sekitar 4 menit) dan meningkatkan dan menurunkan skala dengan respons yang lebih sedikit daripada gudang SQL tanpa server. Lihat Antrean dan penskalaan otomatis untuk gudang SQL pro dan klasik.

Gunakan gudang SQL klasik untuk menjalankan kueri interaktif untuk eksplorasi data dengan performa tingkat pemula dan fitur Databricks SQL.

Catatan

Untuk informasi tentang ukuran gudang SQL Anda dan bagaimana gudang SQL Anda diskalakan sebagai respons terhadap antrean kueri, lihat Antrean dan penskalaan otomatis untuk gudang SQL pro dan klasik.

Apa saja default jenis gudang?

Untuk ruang kerja di wilayah yang mendukung gudang SQL tanpa server dan memenuhi persyaratan:

  • Menggunakan UI, jenis gudang SQL default tidak memiliki server.
  • Menggunakan SQL warehouses API dengan parameter default, jenis gudang SQL default adalah klasik. Untuk menggunakan tanpa server, atur parameter ke enable_serverless_compute true dan atur warehouse_type juga ke pro. Jika ruang kerja ini menggunakan SQL warehouses API untuk membuat gudang antara 1 November 2022 dan 19 Mei 2023, dan sesuai dengan persyaratan untuk gudang SQL tanpa server, defaultnya tetap diatur ke true. Untuk menghindari ambiguitas, terutama bagi organisasi dengan banyak ruang kerja, Databricks merekomendasikan agar Anda selalu mengatur bidang ini.
  • Jika ruang kerja menggunakan metastore Apache Hive eksternal warisan, gudang SQL tanpa server tidak didukung. Jenis gudang SQL default sama dengan jika komputasi tanpa server dinonaktifkan, yaitu pro di UI dan klasik menggunakan API. Selain itu, hubungi tim akun Azure Databricks Anda untuk mempelajari selengkapnya tentang Katalog Unity atau opsi lainnya.

Untuk ruang kerja yang tidak mendukung gudang SQL tanpa server:

  • Menggunakan UI, jenis gudang SQL default adalah pro.
  • Menggunakan SQL warehouses API dengan parameter default, jenis gudang SQL default adalah klasik.