Aracılığıyla paylaş


Dış tablolarla çalışma

Dış tablolar, verileri bulut kiracınızdaki bulut nesne depolama alanında bir dizinde depolar. Dış tablo tanımlarken bir depolama konumu belirtmeniz gerekir.

Databricks, dış tabloların yalnızca Azure Databricks'te işlem kullanmadan verilere doğrudan erişmeniz gerektiğinde kullanılmasını önerir. Unity Kataloğu ayrıcalıkları, kullanıcılar dış sistemlerden veri dosyalarına eriştiğinde uygulanmaz.

Not

Bu makale Unity Kataloğu dış tablolarına odaklanır. Eski Hive meta veri deposundaki dış tabloların farklı davranışları vardır. Bkz. Eski Hive meta veri deposundaki veritabanı nesneleri.

Dış tablolarla çalışma

Azure Databricks yalnızca dış tablolar için meta verileri yönetir ve içeren şemayla ilişkili depolama konumunu yönetmeyi kullanmaz. Unity Kataloğu'ndaki tablo kaydı yalnızca veri dosyalarının işaretçisidir. Dış tabloyu bıraktığınızda veri dosyaları silinmez.

Dış tablo oluşturduğunuzda, mevcut bir veri dosyaları dizinini tablo olarak kaydedebilir veya yeni veri dosyaları oluşturmak için bir yol sağlayabilirsiniz.

Dış tablolar aşağıdaki dosya biçimlerini kullanabilir:

  • DELTA
  • CSV
  • JSON
  • AVRO
  • PARKE
  • ORC
  • METİN

Dış tablo oluşturma

Dış tablo oluşturmak için SQL komutlarını veya Dataframe yazma işlemlerini kullanabilirsiniz.

Başlamadan önce

Dış tablo oluşturmak için aşağıdaki izin gereksinimlerini karşılamanız gerekir:

  • Dış CREATE EXTERNAL TABLE tablo tarafından erişilene LOCATION erişim izni veren bir dış konumdaki ayrıcalık.
  • USE SCHEMA Tablonun üst şeması üzerindeki izin.
  • USE CATALOG Tablonun üst kataloğundaki izin.
  • CREATE TABLE Tablonun üst şeması üzerindeki izin.

Dış konumları yapılandırma hakkında daha fazla bilgi için bkz . Bulut depolama alanını Azure Databricks'e bağlamak için dış konum oluşturma.

SQL komut örnekleri

Dış tablo oluşturmak için bir not defterinde veya SQL sorgu düzenleyicisinde aşağıdaki komut örneklerinden birini kullanın.

Aşağıdaki örneklerde yer tutucu değerlerini değiştirin:

  • <catalog>: Tabloyu içerecek kataloğun adı.
  • <schema>: Tabloyu içerecek şemanın adı.
  • <table-name>: Tablo için bir ad.
  • <column-specification>: Her sütunun adı ve veri türü.
  • <bucket-path>: Tablonun oluşturulacağı bulut depolama demetinin yolu.
  • <table-directory>: Tablonun oluşturulacağı dizin. Her tablo için benzersiz bir dizin kullanın.
CREATE TABLE <catalog>.<schema>.<table-name>
(
  <column-specification>
)
LOCATION 'abfss://<bucket-path>/<table-directory>';

Tablo oluşturma parametreleri hakkında daha fazla bilgi için bkz . CREATE TABLE.

Veri çerçevesi yazma işlemleri

Birçok kullanıcı sorgu sonuçlarından veya DataFrame yazma işlemlerinden dış tablolar oluşturur. Aşağıdaki makalelerde, Azure Databricks'te dış tablo oluşturmak için kullanabileceğiniz birçok desenden bazıları gösterilmektedir:

Dış tabloyu bırakma

Tabloyu bırakmak için sahibi olmanız gerekir. Dış tabloyu bırakmak için aşağıdaki SQL komutunu çalıştırın:

DROP TABLE IF EXISTS catalog_name.schema_name.table_name;

Unity Kataloğu, dış tabloyu bıraktığınızda bulut depolamadaki temel verileri silmez. Tabloyla ilişkili verileri kaldırmanız gerekiyorsa, temel alınan veri dosyalarını doğrudan silmeniz gerekir.

Örnek not defteri: Dış tablolar oluşturma

Katalog, şema ve dış tablo oluşturmak ve bunlar üzerindeki izinleri yönetmek için aşağıdaki örnek not defterini kullanabilirsiniz.

Unity Kataloğu not defterinde dış tablo oluşturma ve yönetme

Not defterini alma