Aracılığıyla paylaş


Azure Databricks tabloları kavramları

Azure Databricks tablosu bir şemada bulunur ve veri satırları içerir. Azure Databricks'te oluşturulan varsayılan tablo türü Unity Kataloğu yönetilen tablosudur.

Aşağıdaki örnekte, yaklaşık beş çalışanın verilerini içeren adlı prod.people_ops_employees bir yönetilen tablo gösterilmektedir. Yönetilen tablo olarak, veri dosyaları Unity Kataloğu'nun bulut depolamadaki yönetilen depolama konumunda depolanır.

Çalışan verilerini içeren örnek tablo

Depolama biçimleri

Azure Databricks'teki tablo türleri, verilerin nasıl sahip olunup erişilir olduğunu tanımlar. Ayrı olarak, depolama biçimi verilerin fiziksel olarak nasıl yapılandırıldığını ve diskte nasıl izlendiğini tanımlar.

Azure Databricks iki birincil açık tablo depolama biçimi destekler:

  • Delta Lake , Azure Databricks'teki yönetilen ve dış tablolar için varsayılan depolama biçimidir. Delta, yabancı tablolar için de desteklenir.
  • Apache Iceberg , Azure Databricks'teki yönetilen ve yabancı tablolarda desteklenir. Bu biçim, Iceberg ekosistemiyle tümleştirme yaparken kullanışlıdır.

Bu biçimler meta verileri izleyen ve Bölünmezlik, Tutarlılık, Yalıtım ve Dayanıklılık (ACID) uyumluluğu, zaman yolculuğu ve diğer özellikleri etkinleştiren bir işlem depolama katmanı ekler.

Tablo türleri

Azure Databricks, her biri farklı veri yönetimi senaryoları ve sahiplik modelleri için tasarlanmış üç birincil tablo türü sunar. Tablo türü seçiminiz, Azure Databricks'in temel alınan veri dosyalarını ve meta verileri nasıl yöneteceğini belirler.

Azure Databricks'teki tablo türleri için birincil ayırıcı, aşağıdaki tabloda açıklandığı gibi sahip olan katalogdur:

Tablo türü Kataloğu yönetme Okuma/yazma desteği Performans iyileştirme Depolama maliyeti iyileştirme
Yönetilen Unity Kataloğu Yes Yes Yes
Dış Hiçbiri (yalnızca dosyalar) Yes Yalnızca el ile Yalnızca el ile
Yabancı Dış sistem veya katalog hizmeti Yalnızca Okunur Hayı Hayı

Yönetilen tablolar

Yönetilen tablolar, meta veri deposu kaydıyla birlikte temel alınan veri dosyalarını yönetir. Databricks, her yeni tablo oluşturduğunuzda yönetilen tabloları kullanmanızı önerir. Unity Kataloğu yönetilen tabloları, Azure Databricks'te tablo oluşturduğunuzda varsayılandır. Bkz. Yönetilen tablolar.

Dış tablolar

Bazen yönetilmeyen tablolar olarak da adlandırılan dış tablolar, bulut nesne depolaması gibi bir dış depolama sisteminde Databricks dışında depolanan verilere başvurur. Bunlar, temel alınan veri dosyalarının yönetimini meta veri deposu kaydından ayrıştırırlar. Unity Kataloğu, Delta Lake de dahil olmak üzere çeşitli biçimlerde dış tabloları destekler. Unity Kataloğu dış tabloları, dış sistemler tarafından okunabilen ortak biçimleri kullanarak veri dosyalarını depolayabilir. Bkz. Dış tablolar.

Harici veritabanı tabloları

Yabancı tablolar, Lakehouse Federasyonu aracılığıyla Azure Databricks'e bağlı dış sistemlerde depolanan verileri temsil eder. Yabancı tablolar Azure Databricks'te salt okunur durumdadır. Bkz. Yabancı tablolar.

Unity Kataloğu'ndaki tablolar

Unity Kataloğu'nda tablolar, aşağıdaki diyagramda gösterildiği gibi üç düzeyli ad alanının (catalog.schema.table ) üçüncü düzeyinde yer alıyor:

Tabloya odaklanan Unity Kataloğu nesne modeli diyagramı

Temel tablo izinleri

Çoğu tablo işlemi, tablo içeren katalog ve şema üzerinde ve USE CATALOG izinleri gerektirirUSE SCHEMA.

Aşağıdaki tabloda Unity Kataloğu'ndaki yaygın tablo işlemleri için gereken ek izinler özetlemektedir:

Operation Permissions
Tablo oluştur CREATE TABLE içeren şemada
Tablo sorgulama SELECT tabloda
Tabloya veri güncelleştirme, silme, birleştirme veya ekleme SELECT ve MODIFY tabloda
Tabloyu bırakma MANAGE tabloda
Tabloyu değiştirme MANAGE tablosunda, CREATE TABLE içeren şemada

Unity Kataloğu izinleri hakkında daha fazla bilgi için bkz. Unity Kataloğu'nda ayrıcalıkları yönetme.