Veri kaynaklarına bağlanma

Bu makalede yöneticilerin ve diğer güçlü kullanıcıların Azure Databricks ile veri kaynakları arasındaki bağlantıları nasıl yapılandırabileceğine ilişkin ayrıntılı öneriler sağlanmaktadır. Dış sistemdeki verileri okuma erişiminizin olup olmadığını belirlemeye çalışıyorsanız, çalışma alanınızda erişiminiz olan verileri gözden geçirerek başlayın. Bkz. Verileri bulma.

Azure Databricks hesabınızı bulut nesne depolaması, ilişkisel veritabanı yönetim sistemleri, akış veri hizmetleri ve CRM'ler gibi kurumsal platformlar gibi veri kaynaklarına bağlayabilirsiniz. Bağlantıları yapılandırmak için gereken belirli ayrıcalıklar veri kaynağına, Azure Databricks çalışma alanınızdaki izinlerin nasıl yapılandırıldığına, kaynaktaki verilerle etkileşim kurmak için gereken izinlere, veri idare modelinize ve bağlanmak için tercih ettiğiniz yönteme bağlıdır.

Çoğu yöntem, sistemleri tümleştirmek için gerekli izinleri yapılandırmak için hem veri kaynağında hem de Azure Databricks çalışma alanında yükseltilmiş ayrıcalıklar gerektirir. Bu izinlere sahip olmayan kullanıcılar yardım istemelidir. Bkz. Veri kaynaklarına erişim isteme.

Nesne depolama bağlantılarını yapılandırma

Bulut nesne depolaması, Azure Databricks'te çoğu veriyi depolamak için temel sağlar. Bulut nesne depolaması ve Azure Databricks'in verileri nerede depoladığı hakkında daha fazla bilgi edinmek için bkz . Azure Databricks verileri nereye yazar?.

Databricks, bulut nesne depolamasına erişimi yapılandırmak için Unity Kataloğu'nu kullanmanızı önerir. Unity Kataloğu, bulut nesne depolama alanında hem yapılandırılmış hem de yapılandırılmamış veriler için veri idaresi sağlar. Bkz. Unity Kataloğu'nu kullanarak bulut nesne depolamaya Bağlan.

Unity Kataloğu kullanmayan müşterilerin eski yöntemleri kullanarak bağlantıları yapılandırmaları gerekir. Bkz. Azure Databricks için bulut nesne depolamasına erişimi yapılandırma.

Ağı bulut nesne depolama alanına yapılandırmak için bkz . Ağ oluşturma.

Dış veri sistemlerine bağlantıları yapılandırma

Databricks, gereksinimlerinize bağlı olarak dış veri sistemlerine bağlantıları yapılandırmak için çeşitli seçenekler önerir. Aşağıdaki tabloda bu seçeneklere üst düzey bir genel bakış sağlanmaktadır:

Seçenek Açıklama
Lakehouse Federasyonu Kurumsal veri sistemlerindeki verilere salt okunur erişim sağlar. Bağlan ions, Unity Kataloğu aracılığıyla katalog veya şema düzeyinde yapılandırılır ve birden çok tabloyu tek bir yapılandırmayla eşitler. Bkz . Lakehouse Federasyonu nedir?
İş ortağı Bağlan Dış veri kaynaklarına bağlanmak ve lakehouse'a veri alımını otomatikleştirmek için teknoloji iş ortağı çözümlerinden yararlanır. Bazı çözümler arasında ters ETL ve dış sistemlerden lakehouse verilerine doğrudan erişim de bulunur. Bkz. Databricks İş Ortağı Bağlan nedir?
Sürücüler Azure Databricks, her Databricks Runtime'daki dış veri sistemleri için sürücüler içerir. İsteğe bağlı olarak, diğer sistemlerdeki verilere erişmek için üçüncü taraf sürücüleri yükleyebilirsiniz. Her tablo için bağlantıları yapılandırmanız gerekir. Bazı sürücüler yazma erişimi içerir. Bkz. Dış sistemlere Bağlan.
JDBC Yerel JDBC desteği üzerine inşa edilen dış sistemler için dahil edilen çeşitli sürücüler ve JDBC seçeneği, diğer sistemlere bağlantıları yapılandırmak için genişletilebilir seçenekler sağlar. Her tablo için bağlantıları yapılandırmanız gerekir. Bkz. JDBC kullanarak veritabanlarını sorgulama.

Akış veri kaynaklarına Bağlan

Azure Databricks, birçok akış veri sistemi için iyileştirilmiş bağlayıcılar sağlar.

Tüm akış veri kaynakları için erişim sağlayan kimlik bilgileri oluşturmanız ve bu kimlik bilgilerini Azure Databricks'e yüklemeniz gerekir. Databricks, tüm yapılandırma seçeneklerinde ve tüm erişim modlarında gizli dizileri kullanabileceğiniz için gizli dizileri kullanarak kimlik bilgilerinin depolanmasını önerir.

Akış kaynakları için tüm veri bağlayıcıları, akış sorguları tanımlarken seçenekleri kullanarak kimlik bilgilerinin geçirilmesini destekler. Bkz . Akış veri kaynaklarını yapılandırma.

Veri kaynaklarına erişim isteme

Birçok kuruluşta kullanıcıların çoğu Azure Databricks veya dış veri kaynaklarında veri bağlantılarını yapılandırmak için yeterli ayrıcalıklara sahip değildir.

Kuruluşunuz, bu sayfadan bağlantılı makalelerde açıklanan desenlerden birini kullanarak bir veri kaynağına erişimi zaten yapılandırmış olabilir. Kuruluşunuzun verilere erişim istemek için iyi tanımlanmış bir işlemi varsa, Databricks bu sürecin izlenmesini önerir.

Bir veri kaynağına nasıl erişim kazanabileceğinizden emin değilseniz, bu yordam size yardımcı olabilir:

  1. Erişebileceğiniz tabloları ve birimleri görüntülemek için Katalog Gezgini'ni kullanın. Bkz . Katalog Gezgini nedir?.
  2. Ekip arkadaşlarınıza veya yöneticilerinize erişebilecekleri veri kaynaklarını sorun.
    • Çoğu kuruluş, çalışma alanı kullanıcılarının izinlerini yönetmek için kimlik sağlayıcılarından eşitlenen grupları (örneğin: Okta veya Microsoft Entra Id (eski adıYla Azure Active Directory)) kullanır. Ekibinizin diğer üyeleri erişmeniz gereken veri kaynaklarına erişebiliyorsa, çalışma alanı yöneticisinin size erişim vermek için sizi doğru gruba eklemesini sağlayın.
    • Belirli bir tablo, birim veya veri kaynağı bir iş arkadaşı tarafından yapılandırıldıysa, bu kişinin size verilere erişim izni verme izinleri olmalıdır.
  3. Bazı kuruluşlar, işlem kümeleri ve SQL ambarları üzerindeki ayarlar aracılığıyla veri erişimi izinlerini yapılandırıyor.
    • Veri kaynaklarına erişim, hesaplamaya göre farklılık gösterebilir.
    • İşlem sekmesinde işlem oluşturucusunu görüntüleyebilirsiniz. Erişilebilir olması gereken veri kaynakları hakkında soru sormak için oluşturucuya ulaşın.