Katalog oluşturma
Bu makalede Unity Kataloğu'nda katalog oluşturma gösterilmektedir. Katalog şemalar (veritabanları) içerir ve şema tablolar, görünümler, birimler, modeller ve işlevler içerir.
Kataloglar hakkında daha fazla bilgi edinmek için bkz . Azure Databricks'te kataloglar nelerdir?.
Not
Dış veri sistemindeki bir veritabanını yansıtan bir Unity Kataloğu nesnesi olan yabancı katalog oluşturmayı öğrenmek için bkz . Yabancı katalog oluşturma. Ayrıca bkz. Yabancı katalogları yönetme ve bunlarla çalışma.
Gereksinimler
Katalog türünden bağımsız olarak katalog oluşturmak için:
- Azure Databricks meta veri deposu yöneticisi olmanız veya meta veri deposunda ayrıcalığınız olması
CREATE CATALOG
gerekir. - Katalog oluşturmak için not defterini çalıştırmak için kullandığınız işlem kaynağının Databricks Runtime 11.3 veya üzerinde olması ve Unity Kataloğu uyumlu erişim modunu kullanması gerekir. Bkz. Erişim modları. SQL ambarları her zaman Unity Kataloğu'nu destekler.
Paylaşılan katalog oluşturmak için:
- Delta Sharing paylaşımı çalışma alanınızda zaten mevcut olmalıdır. Bkz. Nasıl yaparım? paylaşılan verileri ekibimin kullanımına sunsun mu?.
- Meta veri deposu yöneticisi olmanız,
USE PROVIDER
meta veri deposunda ayrıcalığınız olması veya paylaşımı içeren sağlayıcı nesnesine sahip olmanız gerekir.
Standart katalog oluşturmak için:
- Katalog için yönetilen bir depolama konumu belirtirseniz, hedef dış konumda ayrıcalığınız olmalıdır
CREATE MANAGED STORAGE
. - Meta veri deposu düzeyinde yönetilen depolama yoksa, katalog için yönetilen bir depolama konumu belirtmeniz gerekir .
Yabancı katalog oluşturmak için:
- Yabancı kataloğu oluşturmak için kullandığınız bağlantının sahibi olmanız veya bağlantıda ayrıcalığınız olması
CREATE FOREIGN CATALOG
gerekir. - Databricks Runtime 13.1 veya üzerinde işlem kullanmanız gerekir. SQL ambarları Pro veya Sunucusuz olmalıdır.
Katalog oluşturma
Katalog oluşturmak için Katalog Gezgini'ni, SQL komutunu, REST API'yi, Databricks CLI'yı veya Terraform'u kullanabilirsiniz. Katalog oluşturduğunuzda otomatik olarak iki şema (veritabanları) oluşturulur: default
ve information_schema
.
Katalog Gezgini
Meta veri deposuna bağlı bir çalışma alanında oturum açın.
Katalog'a tıklayın .
Katalog Oluştur düğmesine tıklayın.
Yeni katalog oluştur iletişim kutusunda bir Katalog adı girin ve oluşturmak istediğiniz katalog Türünü seçin:
- Standart katalog: Unity Kataloğu tarafından yönetilen verileri ve yapay zeka varlıklarını düzenleyen güvenli hale getirilebilir bir nesne. Lakehouse Federasyonu ve Delta Sharing paylaşımlarından oluşturulan kataloglar dışındaki tüm kullanım örnekleri için.
- Yabancı katalog: Lakehouse Federation kullanarak dış veri sistemindeki bir veritabanını yansıtan güvenli hale getirilebilir bir nesne. Bkz . Lakehouse Federasyonu kurulumuna genel bakış.
- Paylaşılan katalog: Sizinle Delta Sharing paylaşımı olarak paylaşılan verileri ve diğer varlıkları düzenleyen güvenli hale getirilebilir bir nesne. Bir paylaşımdan katalog oluşturmak, bu varlıkları çalışma alanınızdaki kullanıcıların okuması için kullanılabilir hale getirir. Bkz. Paylaşım nedir?.
Katalog türüne bağlı olarak aşağıdaki seçenekleri belirtin:
Standart kataloglar için: İsteğe bağlıdır ancak yönetilen bir Depolama konumu belirtmeniz kesinlikle önerilir. Yönetilen depolama konumu olarak kullandığınız hedef dış konumda ayrıcalığınız olmalıdır
CREATE MANAGED STORAGE
. Bkz . Unity Kataloğu'nda yönetilen depolama konumu belirtme.İsteğe bağlı olarak tanımlı bir dış konumun alt yolu belirtebilirsiniz. Tanımlanmış bir dış konumunuz yoksa, Yeni dış konum oluştur'a tıklayarak bir konum oluşturabilirsiniz.
Önemli
Çalışma alanınızın meta veri deposu düzeyinde depolama konumu yoksa, katalog oluştururken yönetilen depolama konumu belirtmeniz gerekir .
Yabancı kataloglar için: Unity Kataloğu'nda dış veritabanı sistemine erişmek için bir yol ve kimlik bilgileri belirten güvenli hale getirilebilir bir nesne olan bir Bağlantı seçmelisiniz. Bkz . Lakehouse Federasyonu kurulumuna genel bakış.
Bağlantıyı seçtiğinizde, yansıtmak istediğiniz Veritabanı veya diğer Databricks Kataloğu'nun adını girin.
Gereksinimler veri kaynağına bağlı olarak farklılık gösterir:
- MySQL iki katmanlı bir ad alanı kullanır ve bu nedenle veritabanı adı gerektirmez.
- Başka bir Databricks çalışma alanındaki bir kataloğa bağlantılar için veritabanı adı yerine Databricks Kataloğu adını girin.
Tanımlanmış bir bağlantınız yoksa, Yeni bağlantı oluştur'a tıklayarak bir bağlantı oluşturabilirsiniz.
Paylaşılan kataloglar için: Sağlayıcı ve Paylaşım seçmelisiniz. Sağlayıcıyı seçtikten sonra sağlayıcının paylaşımlarından birini seçebilirsiniz.
Hangi sağlayıcıyı ve paylaşımı istediğinizden emin değilseniz, Katalog Gezgini tarayıcısını kullanarak sağlayıcılara ve paylaşımlara göz atabilir veya paylaşımları arayabilirsiniz. Bkz. Sağlayıcıları görüntüleme ve Bir sağlayıcının sizinle paylaştığı paylaşımları görüntüleme.
Oluştur’a tıklayın.
Katalog oluşturuldu! iletişim kutusunda Kataloğu otomatik olarak yapılandırıldığı gibi kabul etmek için Kataloğu görüntüle'ye veya katalog izinlerini, çalışma alanı bağlamalarını ve meta verileri yapılandırmak için Kataloğu yapılandır (önerilen) seçeneğine tıklayın.
Kataloğu görüntüle'ye tıklarsanız, kataloğa meta veri deposuna bağlı tüm çalışma alanları erişebilir ve
BROWSE
tüm hesap kullanıcılarına ayrıcalık verilir. Bu yordamdaki diğer adımları atlayabilir ve kataloğa şema eklemeye devam edebilirsiniz. Bkz . Şema oluşturma.Sahibi, etiketleri, açıklamaları, çalışma alanı bağlamalarını, izinleri ve şemaları güncelleştirmek için istediğiniz zaman Katalog Gezgini'ndeki katalog ayrıntıları sayfasına dönebilirsiniz.
Katalog Çalışma Alanlarını Yapılandır sayfasında, kataloğun > bağlı olduğu çalışma alanını belirtin.
Varsayılan olarak, katalog geçerli meta veri deposuna eklenmiş olan tüm çalışma alanlarıyla paylaşılır. Katalog belirli çalışma alanlarıyla sınırlı olması gereken veriler içerecekse, Tüm çalışma alanının erişimi var seçeneğini temizleyin ve bu çalışma alanlarını eklemek için Çalışma alanlarına ata düğmesini kullanın. Geçerli çalışma alanı dahil edilmelidir.
Çalışma alanını atadıktan sonra, isteğe bağlı olarak varsayılan Okuma ve Yazma erişim düzeyini Salt Okunur olarak değiştirebilirsiniz: listeden çalışma alanını seçin ve Erişim Düzeyini Yönet düğmesine tıklayın.
Daha fazla bilgi için bkz . Katalog erişimini belirli çalışma alanlarıyla sınırlama.
Kataloğunuz için İzinler atamak için İleri'ye tıklayın.
Tüm hesap kullanıcıları
BROWSE
varsayılan olarak bu ayrıcalığı kullanarak verilere okuma erişimi olmadan katalog meta verilerini bulma olanağına sahiptir.Kullanıcıya, gruba veya hizmet sorumlusuna ayrıcalık vermek için Ver'e tıklayın ve Unity Kataloğu ayrıcalıkları ve güvenliği sağlanabilir nesneler başlığındaki yönergeleri izleyin.
İsteğe bağlı etiket ve açıklama Meta Verileri eklemek için İleri'ye tıklayın.
Etiketler , veri varlıklarınızı aramayı ve bulmayı basitleştirmek için katalogları düzenlemek ve kategorilere ayırmak için kullanabileceğiniz anahtar-değer çiftleridir. Değerler isteğe bağlıdır. Bkz . Unity Kataloğu güvenli hale getirilebilir nesnelere etiket uygulama.
Açıklama, kullanıcıların katalogdaki veri varlıklarını bulmasına yardımcı olmak için genellikle bir açıklama sağlamak için kullanılan açık uçlu bir alandır. Bkz. Verilere ve yapay zeka varlıklarına açıklama ekleme.
Kaydet'e tıklayın.
Kataloğa şemalar ve veri nesneleri ekleyin.
Bkz . Şema oluşturma.
Kataloğu oluşturduktan sonra istediğiniz zaman sahibi, etiketleri, açıklamaları, çalışma alanı bağlamalarını ve izinleri güncelleştirmek için Katalog Gezgini'ni kullanabilirsiniz.
SQL
Standart katalog oluşturmak için not defterinde veya SQL sorgu düzenleyicisinde aşağıdaki SQL komutunu çalıştırın. Köşeli ayraç içindeki öğeler isteğe bağlıdır. Yer tutucu değerlerini değiştirin:
<catalog-name>
: Katalog için bir ad.<location-path>
: İsteğe bağlı ancak kesinlikle önerilir. Bu katalogdaki yönetilen tabloların meta veri deposu için yapılandırılan varsayılan kök depolamadan farklı bir konumda depolanmasını istiyorsanız bir depolama konumu yolu sağlayın.Önemli
Çalışma alanınızın meta veri deposu düzeyinde depolama konumu yoksa, katalog oluştururken yönetilen depolama konumu belirtmeniz gerekir.
Bu yol bir dış konum yapılandırmasında tanımlanmalıdır ve dış konum yapılandırmasında ayrıcalığınız olmalıdır
CREATE MANAGED STORAGE
. Dış konum yapılandırmasında veya bir alt yolda (başka bir deyişle'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance'
veya'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance/product'
) tanımlanan yolu kullanabilirsiniz.<comment>
: İsteğe bağlı açıklama veya başka bir açıklama.
CREATE CATALOG [ IF NOT EXISTS ] <catalog-name>
[ MANAGED LOCATION '<location-path>' ]
[ COMMENT <comment> ];
Örneğin, adlı example
bir katalog oluşturmak için:
CREATE CATALOG IF NOT EXISTS example;
Paylaşılan katalog oluşturmak için not defterinde veya SQL sorgu düzenleyicisinde aşağıdaki komutu çalıştırın. Köşeli ayraç içindeki öğeler isteğe bağlıdır.
CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;
[ COMMENT <comment> ];
Yabancı katalog oluşturmak için not defterinde veya SQL sorgu düzenleyicisinde aşağıdaki komutu çalıştırın. Köşeli ayraç içindeki öğeler isteğe bağlıdır. Yer tutucu değerlerini değiştirin:
<catalog-name>
: Azure Databricks'teki kataloğun adı.<connection-name>
: Veri kaynağını, yolu ve erişim kimlik bilgilerini belirten bağlantı nesnesi .<database-name>
: Azure Databricks'te katalog olarak yansıtmak istediğiniz veritabanının adı. İki katmanlı ad alanı kullanan MySQL için gerekli değildir. Databricks-Databricks Lakehouse Federasyonu için kullanıncatalog '<external-catalog-name>'
.<external-catalog-name>
: Yalnızca Databricks-Databricks : Yansıttığınız dış Databricks çalışma alanında kataloğun adı. Bkz . Başka bir Databricks çalışma alanında federasyon sorguları çalıştırma.
CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
OPTIONS [(database '<database-name>') | (catalog '<external-catalog-name>')];
Ayrıca bkz. Yabancı katalog oluşturma.
Katalog erişimini hesabınızdaki çalışma alanı-katalog bağlaması olarak da bilinen belirli çalışma alanlarıyla sınırlamak için bkz . Katalog erişimini belirli çalışma alanlarıyla sınırlama.
Ayrıntılı parametre açıklamaları için bkz . CREATE CATALOG.
Kataloğu oluşturduktan sonra kataloğa ayrıcalıklar atayın. Bkz . Unity Kataloğu ayrıcalıkları ve güvenliği sağlanabilir nesneler.
Diğer
Terraform: Databricks Terraform sağlayıcısını ve databricks_catalog kullanarak bir katalog oluşturabilirsiniz. databricks_catalogs kullanarak kataloglar hakkında bilgi alabilirsiniz.
REST API: POST /api/2.1/unity-catalog/catalogs kullanın.
Databricks CLI: databricks catalogs create <catalog-name> [options]
Seçeneklerin listesi için komutunu çalıştırın databricks catalogs create -h
. Seçenekler, API başvurusunda da açıklanmıştır. Önceki paragraftaki API bağlantısını izleyin.
Kataloğu oluşturduktan sonra kataloğa ayrıcalıklar atayın. Bkz . Unity Kataloğu ayrıcalıkları ve güvenliği sağlanabilir nesneler.