Azure Databricks'teki veritabanı nesneleri
Azure Databricks, verileri depolamak ve verilere erişmek için iki birincil güvenli hale getirilebilir nesne kullanır.
- Tablo verilerine erişimi tablolar yönetir.
- Birimler tablosal olmayan verilere erişimi yönetir.
Bu makalede, bu veritabanı nesnelerinin Azure Databricks'teki kataloglar, şemalar, görünümler ve diğer veritabanı nesneleriyle ilişkisi açıklanmaktadır. Bu makalede ayrıca veritabanı nesnelerinin genel platform mimarisi bağlamında nasıl çalıştığına ilişkin üst düzey bir giriş sağlanır.
Azure Databricks'teki veritabanı nesneleri nelerdir?
Veritabanı nesneleri, verileri düzenlemenize, erişmenize ve yönetmenize yardımcı olan varlıklardır. Azure Databricks, veritabanı nesnelerini düzenlemek için üç katmanlı bir hiyerarşi kullanır:
- Katalog: En üst düzey kapsayıcı şemaları içerir. Bkz. Azure Databricks'te kataloglar nelerdir?.
- Şema veya veritabanı: Veri nesnelerini içerir. Bkz. Azure Databricks'te şemalar nelerdir?.
- Bir şemada yer alan veri nesneleri:
- Birim: Bulut nesne depolamasında tablosal olmayan verilerin mantıksal birimi. Bkz . Unity Kataloğu birimleri nedir?.
- Tablo: Satırlara ve sütunlara göre düzenlenmiş bir veri koleksiyonu. Bkz. Tablolar ve görünümler nedir?.
- Görünüm: Bir veya daha fazla tabloda kaydedilmiş bir sorgu. Bkz. Görünüm nedir?.
- İşlev: Skaler değer veya satır kümesi döndüren kaydedilmiş mantık. Bkz . Unity Kataloğu'nda Kullanıcı tanımlı işlevler (UDF' ler).
- Model: MLflow ile paketlenmiş bir makine öğrenmesi modeli. Bkz. Unity Kataloğu'nda model yaşam döngüsünü yönetme.
Kataloglar, hesap düzeyinde yönetilen bir meta veri deposuna kaydedilir. Yalnızca yöneticiler meta veri deposuyla doğrudan etkileşim kurar. Bkz. Meta veri depoları.
Azure Databricks, verilerle çalışmak için ek varlıklar sağlar ve bunların tümü çalışma alanı düzeyinde erişim denetimleri veya Databricks veri idare çözümü Unity Kataloğu kullanılarak yönetilebilir:
- Not defterleri, işler ve sorgular gibi çalışma alanı düzeyinde veri varlıkları.
- Birincil olarak depolamaya veya güvenli paylaşıma erişimi denetleyen depolama kimlik bilgileri ve Delta Sharing paylaşımları gibi Unity Kataloğu güvenli hale getirilebilir nesneler.
Daha fazla bilgi için bkz . Veritabanı nesneleri ile çalışma alanı güvenliği sağlanabilir veri varlıkları ve Unity Kataloğu güvenli hale getirilebilir kimlik bilgileri ve altyapı.
Unity Kataloğu'nu kullanarak veritabanı nesnelerine erişimi yönetme
Meta veri deposunun kendisi de dahil olmak üzere hiyerarşideki herhangi bir düzeydeki veritabanı nesnelerine erişim verebilir ve bu nesnelere erişimi iptal edebilirsiniz. Bir nesneye erişim, erişim iptal edilmediği sürece, bu nesnenin tüm alt öğelerine örtük olarak aynı erişimi verir.
Unity Kataloğu'ndaki nesnelere erişim vermek ve bunları iptal etmek için tipik ANSI SQL komutlarını kullanabilirsiniz. Veri nesnesi ayrıcalıklarının kullanıcı arabirimi tabanlı yönetimi için Katalog Gezgini'ni de kullanabilirsiniz.
Unity Kataloğu'nda nesnelerin güvenliğini sağlama hakkında daha fazla bilgi için bkz . Unity Kataloğu'nda güvenli hale getirilebilir nesneler.
Unity Kataloğu'nda varsayılan nesne izinleri
Çalışma alanınızın Unity Kataloğu için nasıl oluşturulduğuna ve etkinleştirildiğine bağlı olarak, kullanıcılarınız katalog veya çalışma alanı kataloğu (<workspace-name>
) dahil main
otomatik olarak sağlanan kataloglarda varsayılan izinlere sahip olabilir. Daha fazla bilgi için bkz . Varsayılan kullanıcı ayrıcalıkları.
Çalışma alanınız Unity Kataloğu için el ile etkinleştirildiyse, çalışma alanınızdaki tüm kullanıcılar tarafından erişilebilen katalogda main
adlı default
bir varsayılan şema içerir. Çalışma alanınız Unity Kataloğu için otomatik olarak etkinleştirildiyse ve bir <workspace-name>
katalog içeriyorsa, bu katalog çalışma alanınızdaki tüm kullanıcıların erişebileceği adlı default
bir şema içerir.
Veritabanı nesneleri ile çalışma alanı güvenliği sağlanabilir veri varlıkları karşılaştırması
Azure Databricks, veritabanı nesnelerinizle birlikte birden çok veri mühendisliği, analiz, ML ve yapay zeka varlığını yönetmenize olanak tanır. Bu veri varlıklarını Unity Kataloğu'nda kaydetmezsiniz. Bunun yerine, bu varlıklar izinleri yönetmek için denetim listeleri kullanılarak çalışma alanı düzeyinde yönetilir. Bu veri varlıkları şunları içerir:
- Notebooks
- Panolar
- İşler
- Pipelines
- Çalışma alanı dosyaları
- SQL sorguları
- Denemeler
Çoğu veri varlığı, verileri sorgulamak, işlevleri kullanmak, modelleri kaydetmek veya diğer yaygın görevleri yapmak için veritabanı nesneleriyle etkileşim kuran mantık içerir. Çalışma alanı veri varlıklarının güvenliğini sağlama hakkında daha fazla bilgi edinmek için bkz . Erişim denetimi listeleri.
Not
İşlem erişimi, erişim denetim listelerine tabidir. İşlemi bir erişim moduyla yapılandırabilirsiniz ve kullanıcıların verilere nasıl erişebileceğini denetleyen ek bulut izinleri ekleyebilirsiniz. Databricks, veri idaresi en iyi uygulaması olarak işlem ilkelerinin kullanılmasını ve küme oluşturma ayrıcalıklarının kısıtlanması önerilir. Bkz. Erişim modları.
Unity Kataloğu güvenli hale getirilebilir kimlik bilgileri ve altyapı
Unity Kataloğu, meta veri deposu düzeyinde kaydedilen güvenli hale getirilebilir nesneleri kullanarak bulut nesne depolamasına, veri paylaşımına ve sorgu federasyonuna erişimi yönetir. Aşağıda, bu veri güvenliği sağlanabilir olmayan nesnelerin kısa açıklamaları yer alır.
Unity Kataloğu'nu bulut nesne depolamasına bağlama
Yeni bir yönetilen depolama konumu oluşturmak veya dış tabloları ya da dış birimleri kaydetmek için depolama kimlik bilgilerini ve dış konumları tanımlamanız gerekir. Bu güvenli hale getirilebilir nesneler Unity Kataloğu'nda kaydedilir:
- Depolama kimlik bilgileri: Bulut depolamaya erişim sağlayan uzun vadeli bulut kimlik bilgileri.
- Dış konum: Eşleştirilmiş depolama kimlik bilgileri kullanılarak erişilebilen bir bulut nesnesi depolama yoluna başvuru.
Bkz . Unity Kataloğu'nu kullanarak bulut nesne depolamasına ve hizmetlerine bağlanma.
Delta Paylaşımı
Azure Databricks, Unity Kataloğu'na aşağıdaki Delta Sharing güvenli hale getirilebilir nesneleri kaydeder:
- Paylaşım: Tablolar, birimler ve diğer veri varlıklarından oluşan salt okunur bir koleksiyon.
- Sağlayıcı: Verileri paylaşan kuruluş veya varlık. Databricks-To-Databricks paylaşım modelinde sağlayıcı, alıcının Unity Kataloğu meta deposuna meta veri deposu kimliğiyle tanımlanan benzersiz bir varlık olarak kaydedilir.
- Alıcı: Bir sağlayıcıdan paylaşım alan varlık. Databricks-Databricks paylaşım modelinde, alıcı sağlayıcıya benzersiz meta veri deposu kimliğiyle tanımlanır.
Lakehouse Federasyonu
Lakehouse Federation, PostgreSQL, MySQL ve Snowflake gibi diğer sistemlerde bulunan verilere salt okunur erişim sağlamak için yabancı kataloglar oluşturmanıza olanak tanır. Yabancı kataloglar oluşturmak için dış sisteme bir bağlantı tanımlamanız gerekir.
Bağlantı: Unity Kataloğu güvenli hale getirilebilir nesnesi, Lakehouse Federasyon senaryosunda dış veritabanı sistemine erişmek için bir yol ve kimlik bilgileri belirtir.
Bkz. Lakehouse Federasyonu nedir?.
Yönetilen birimler ve tablolar için yönetilen depolama konumları
Azure Databricks tablo ve birimleri oluşturduğunuzda, bunları yönetilen veya dış yapma seçeneğiniz vardır. Unity Kataloğu, Azure Databricks'ten dış tablolara ve birimlere erişimi yönetir, ancak temel alınan dosyaları denetlemez veya bu dosyaların depolama konumunu tam olarak yönetmez. Yönetilen tablolar ve birimler ise Unity Kataloğu tarafından tamamen yönetilir ve içeren şemayla ilişkili yönetilen bir depolama konumunda depolanır. Bkz . Unity Kataloğu'nda yönetilen depolama konumu belirtme.
Databricks, yapılandırma, iyileştirme ve idareyi basitleştirdiğinden çoğu iş yükü için yönetilen birimler ve yönetilen tablolar önerir.
Unity Kataloğu ile eski Hive meta veri deposu karşılaştırması
Databricks, tüm veritabanı nesnelerini kaydetmek ve yönetmek için Unity Kataloğu'nu kullanmanızı önerir, ancak aynı zamanda şemaları, tabloları, görünümleri ve işlevleri yönetmek için Hive meta deposu için eski destek sağlar.
Hive meta veri deposu kullanılarak kaydedilen veritabanı nesneleriyle etkileşimde çalışıyorsanız bkz . Eski Hive meta veri deposundaki veritabanı nesneleri.