Aracılığıyla paylaş


Veri kaynaklarına ve dış hizmetlere bağlanma

Bu sayfa, Azure Databricks ile dış veri kaynakları ve hizmetleri arasındaki bağlantıları yapılandıran yöneticiler ve güç kullanıcıları için öneriler sağlar.

Azure Databricks hesabınızı bulut nesne depolaması, ilişkisel veritabanı yönetim sistemleri, akış veri hizmetleri ve CRM'ler gibi kurumsal platformlar gibi veri kaynaklarına bağlayabilirsiniz. Azure Databricks hesabınızı depolama dışı dış hizmetlere de bağlayabilirsiniz.

Nesne depolama bağlantılarını yapılandırma

Azure Databricks iş yükleri tarafından kullanılan verilerin çoğu, Azure Data Lake Storage veya AWS S3 gibi bulut nesne depolama alanında depolanır. Aşağıdakilerden birini kullanarak bulut nesne depolamasına erişimi yönetebilirsiniz:

Dış veri sistemlerine bağlantıları yapılandırma

Databricks, dış veri sistemlerine bağlantıları yapılandırmak için çeşitli seçenekler sunar. Aşağıdaki tabloda bu seçeneklere üst düzey bir genel bakış sağlanmaktadır:

Option Description
Federasyon bağlayıcılarını sorgulama Lakehouse Federation, kurumsal veri sistemlerindeki verilere salt okunur erişim sağlar. Sorgu federasyonu , PostgreSQL ve MySQL gibi dış veri sistemlerine federasyon sağlamak için güvenli JDBC bağlantıları kullanır. Katalog federasyonu , verileri doğrudan dosya depolama alanında sorgulamak için Hive Meta Veri Deposu veya Snowflake Horizon Kataloğu gibi dış katalogları bağlar.
Yönetilen veri alma bağlayıcıları Lakeflow Connect, yönetici kullanıcıların veri alımı kullanıcı arabiriminde aynı anda bir bağlantı ve yönetilen alım işlem hattı oluşturmasına olanak tanır. Lakeflow Connect'te Yönetilen Bağlayıcılar kısmına bakın.
İşlem hattı oluşturacak kullanıcılar yönetici olmayan kullanıcılarsa veya Databricks API'leri, Databricks SDK'ları, Databricks CLI veya Databricks Varlık Paketleri kullanmayı planlıyorsa, bir yöneticinin önce Katalog Gezgini'nde bağlantıyı oluşturması gerekir. Bu arabirimler, kullanıcıların işlem hattı oluştururken mevcut bir bağlantı belirtmelerini gerektirir. Bkz Yönetilen alım kaynaklarına bağlanın.
Akış bağlayıcıları Azure Databricks, birçok akış veri sistemi için iyileştirilmiş bağlayıcılar sağlar.
Tüm akış veri kaynakları için erişim sağlayan kimlik bilgileri oluşturmanız ve bu kimlik bilgilerini Azure Databricks'e yüklemeniz gerekir. Databricks, tüm yapılandırma seçeneklerinde ve tüm erişim modlarında gizli dizileri kullanabileceğiniz için gizli dizileri kullanarak kimlik bilgilerinin depolanmasını önerir.
Akış kaynakları için tüm veri bağlayıcıları, akış sorguları tanımlarken seçenekleri kullanarak kimlik bilgilerinin geçirilmesini destekler. Bkz. Lakeflow Connect'te standart bağlayıcılar.
Üçüncü taraf tümleştirmeleri Dış veri kaynaklarına bağlanmak ve lakehouse'a veri alımını otomatikleştirmek için üçüncü taraf araçlarını kullanın. Bazı çözümler arasında ters ETL ve dış sistemlerden lakehouse verilerine doğrudan erişim de bulunur. Bkz Databricks İş Ortağı Bağlantısı nedir?.
Drivers Azure Databricks, her Databricks Runtime'daki dış veri sistemleri için sürücüler içerir. İsteğe bağlı olarak, diğer sistemlerdeki verilere erişmek için üçüncü taraf sürücüleri yükleyebilirsiniz. Her tablo için bağlantıları yapılandırmanız gerekir. Bazı sürücüler yazma erişimi içerir. Bkz . Dış sistemlere bağlanma.
Salt okunur sorgu federasyonu için Lakehouse Federasyonu her zaman bu sürücülere göre tercih edilir.
JDBC Yerel JDBC desteği üzerine inşa edilen dış sistemler için dahil edilen çeşitli sürücüler ve JDBC seçeneği, diğer sistemlere bağlantıları yapılandırmak için genişletilebilir seçenekler sağlar. Her tablo için bağlantıları yapılandırmanız gerekir. Bkz. JDBC kullanarak veritabanlarını sorgulama.
Salt okunur sorgu federasyonu için Lakehouse Federasyonu her zaman bu sürücülere göre tercih edilir.

Dış hizmetlere bağlantıları yapılandırma

Unity Kataloğu, hizmet kimlik bilgisi olarak adlandırılan güvenli hale getirilebilir bir nesne kullanarak depolama dışı hizmetlere erişimi yönetir. Hizmet kimlik bilgileri, kullanıcıların Azure Databricks'ten bağlanması gereken bir dış hizmete erişim sağlayan uzun vadeli bir bulut kimlik bilgilerini kapsüller. Bkz . Unity Kataloğu'nu kullanarak dış bulut hizmetlerine bağlanma

Veri kaynaklarını ve dış hizmetleri yönetme ve bu hizmetlere erişim isteme

Bağlantı yöntemlerinin çoğu hem dış veri kaynağında veya hizmetinde hem de Azure Databricks çalışma alanında yükseltilmiş ayrıcalıklar gerektirir. Tipik kuruluşlarda, az sayıda kullanıcı Azure Databricks'te veya dış veri ve depolama sağlayıcılarında veri bağlantılarını kendileri yapılandırmak için yeterli ayrıcalıklara sahiptir.

Kuruluşunuz, bu sayfadan bağlantılı makalelerde açıklanan desenlerden birini kullanarak bir veri kaynağına veya hizmete erişimi zaten yapılandırmış olabilir. Kuruluşunuzun verilere ve üçüncü taraf hizmetlere erişim istemek için iyi tanımlanmış bir süreci varsa Databricks bu sürecin izlenmesini önerir. Bir veri kaynağına nasıl erişim kazanabileceğinizden emin değilseniz, bu yordam yardımcı olabilir:

  1. Erişebileceğiniz tabloları ve birimleri görüntülemek için Katalog Gezgini'ni kullanın. Bkz . Katalog Gezgini nedir?.
  2. Ekip arkadaşlarınıza veya yöneticilerinize erişebilecekleri veri kaynaklarını sorun.
    • Çoğu kuruluş, çalışma alanı kullanıcılarının izinlerini yönetmek için kimlik sağlayıcılarından eşitlenen grupları (örneğin: Okta veya Microsoft Entra ID) kullanır. Ekibinizin diğer üyeleri erişmeniz gereken veri kaynaklarına erişebiliyorsa, bir çalışma alanı yöneticisinin erişim vermek için sizi doğru gruba eklemesini sağlayın.
    • Belirli bir tablo, birim veya veri kaynağı bir iş arkadaşı tarafından yapılandırıldıysa, bu kişi size verilere erişim izni verebilmelidir.

Bazı kuruluşlar belirli işlem kümelerine ve SQL ambarlarına veri erişim izinleri ekler. Bu eski bir idare modelidir, ancak kuruluşunuz bunu kullanıyorsa ve belirli bir işlem kaynağında hangi veri kaynaklarının kullanılabilir olduğunu öğrenmek istiyorsanız İşlem sekmesinde listelenen işlem oluşturucuya ulaşın.