Aracılığıyla paylaş


Tablo nedir?

Tablo bir şemada bulunur ve veri satırları içerir. Azure Databricks'te oluşturulan tüm tablolar varsayılan olarak Delta Lake kullanır. Delta Lake tarafından desteklenen tablolara Delta tabloları da denir.

Delta tablosu, verileri bulut nesne depolama alanında dosyaların dizini olarak depolar ve tablo meta verilerini bir katalog ve şema içindeki meta veri deposuna kaydeder. Unity Kataloğu tarafından yönetilen tüm tablolar ve akış tabloları Delta tablolarıdır. Unity Kataloğu dış tabloları Delta tabloları olabilir ancak olması gerekmez.

Databricks'te Delta Lake kullanmayan tablolar oluşturmak mümkündür. Bu tablolar Delta tablolarının işlem garantilerini veya iyileştirilmiş performansını sağlamaz. Delta Lake dışındaki biçimleri kullanarak aşağıdaki tablo türlerini oluşturmayı seçebilirsiniz:

  • Dış tablolar.
  • Yabancı tablolar.
  • Eski Hive meta veri deposuna kayıtlı tablolar.

Unity Kataloğu'nda tablolar üç düzeyli ad alanının üçüncü düzeyinde (catalog.schema.table):

Tabloya odaklanan Unity Kataloğu nesne modeli diyagramı

Azure Databricks tablo türleri

Azure Databricks aşağıdaki tablo türlerini kullanmanızı sağlar.

Yönetilen tablolar

Yönetilen tablolar, meta veri deposu kaydıyla birlikte temel alınan veri dosyalarını yönetir. Databricks, her yeni tablo oluşturduğunuzda yönetilen tabloları kullanmanızı önerir. Unity Kataloğu yönetilen tabloları, Azure Databricks'te tablo oluşturduğunuzda varsayılandır. Delta Lake'i her zaman kullanırlar. Bkz. Yönetilen tablolarla çalışma.

Dış tablolar

Bazen yönetilmeyen tablolar olarak da adlandırılan dış tablolar, temel alınan veri dosyalarının yönetimini meta veri deposu kaydından birbirinden kaldırır. Unity Kataloğu dış tabloları, dış sistemler tarafından okunabilen ortak biçimleri kullanarak veri dosyalarını depolayabilir. Bkz . Dış tablolarla çalışma.

Delta tabloları

Delta tablosu terimi, Delta Lake tarafından desteklenen tüm tabloları tanımlamak için kullanılır. Delta tabloları Azure Databricks'te varsayılan olduğundan, tablolara yapılan başvuruların çoğu, aksi belirtilmedikçe Delta tablolarının davranışını açıklar.

Databricks, dosya yolları yerine tam tablo adlarını kullanarak Delta tablolarıyla her zaman etkileşim kurmanızı önerir.

Akış tabloları

Akış tabloları, öncelikli olarak artımlı verileri işlemek için kullanılan Delta tablolarıdır. Akış tablolarındaki güncelleştirmelerin çoğu yenileme işlemleriyle gerçekleşir.

Databricks SQL kullanarak akış tablolarını Unity Kataloğu'na kaydedebilir veya bunları Delta Live Tables işlem hattının bir parçası olarak tanımlayabilirsiniz. Bkz . Databricks SQL'de akış tablolarını kullanarak veri yükleme. ve Delta Live Tables nedir?

Yabancı tablolar

Yabancı tablolar, Lakehouse Federasyonu aracılığıyla Azure Databricks'e bağlı dış sistemlerde depolanan verileri temsil eder. Yabancı tablolar Azure Databricks'te salt okunur durumdadır. Bkz. Lakehouse Federasyonu nedir?.

Özellik tabloları

Birincil anahtarı olan Unity Kataloğu tarafından yönetilen delta tabloları bir özellik tablosudur. İsteğe bağlı olarak, düşük gecikme süreli kullanım örnekleri için çevrimiçi Özellik Deposu'nı kullanarak özellik tablolarını yapılandırabilirsiniz. Bkz . Çalışma alanı özellik deposunda özellik tablolarıyla çalışma.

Hive tabloları (eski)

Hive tabloları, Azure Databricks'te her ikisi de eski desenler olan ve önerilmez olan iki ayrı kavramı açıklar.

Eski Hive meta veri deposu kullanılarak kaydedilen tablolar varsayılan olarak verileri eski DBFS kökünde depolar. Databricks, tüm tabloların eski HMS'den Unity Kataloğu'na geçirilmesini önerir. Bkz. Eski Hive meta veri deposundaki veritabanı nesneleri.

Apache Spark, Hive tablolarını kaydetmeyi ve sorgulamayı destekler, ancak bu codec'ler Azure Databricks için iyileştirilmemiştir. Databricks yalnızca dış sistemler tarafından yazılan verilere yönelik sorguları desteklemek için Hive tablolarının kaydedilmesini önerir. Bkz. Hive tablosu (eski).

Canlı tablolar (kullanım dışı)

Canlı tablolar terimi, gerçekleştirilmiş görünümler olarak uygulanan işlevselliğin daha önceki bir uygulamasını ifade eder. Canlı tablolara başvuran eski kodlar, gerçekleştirilmiş görünümler için söz dizimi kullanacak şekilde güncelleştirilmelidir. Bkz . Delta Live Tables nedir? ve Databricks SQL'de gerçekleştirilmiş görünümleri kullanma.

Temel tablo izinleri

Tablo oluşturmak için, kullanıcıların şema üzerinde ve USE SCHEMA izinlerine sahip CREATE TABLE USE CATALOG olması ve üst kataloğunda izinleri olmalıdır. Bir tabloyu sorgulamak için, kullanıcıların tablo üzerinde izni, USE SCHEMA üst şeması üzerindeki izni ve üst kataloğundaki USE CATALOG izni olmalıdırSELECT.

Unity Kataloğu izinleri hakkında daha fazla bilgi için bkz . Unity Kataloğu'nda ayrıcalıkları yönetme.