Připojení ke zdrojům dat

Tento článek obsahuje názorná doporučení, jak můžou správci a další power uživatelé konfigurovat připojení mezi Azure Databricks a zdroji dat. Pokud se pokoušíte zjistit, jestli máte přístup ke čtení dat z externího systému, začněte kontrolou dat, ke kterým máte přístup ve svém pracovním prostoru. Viz Zjišťování dat.

Svůj účet Azure Databricks můžete připojit ke zdrojům dat, jako je cloudové úložiště objektů, systémy pro správu relačních databází, streamované datové služby a podnikové platformy, jako jsou CRM. Konkrétní oprávnění potřebná ke konfiguraci připojení závisí na zdroji dat, způsobu konfigurace oprávnění v pracovním prostoru Azure Databricks, požadovaných oprávnění pro interakci s daty ve zdroji, modelu zásad správného řízení dat a preferované metodě pro připojení.

Většina metod vyžaduje zvýšená oprávnění pro zdroj dat i pracovní prostor Azure Databricks ke konfiguraci potřebných oprávnění pro integraci systémů. Uživatelé bez těchto oprávnění by měli požádat o pomoc. Viz Žádost o přístup ke zdrojům dat.

Konfigurace připojení úložiště objektů

Cloudové úložiště objektů poskytuje základ pro ukládání většiny dat v Azure Databricks. Další informace o cloudovém úložišti objektů a o tom, kde Azure Databricks ukládá data, najdete v tématu Kde Azure Databricks zapisuje data?

Databricks doporučuje ke konfiguraci přístupu ke cloudovému úložišti objektů pomocí katalogu Unity. Katalog Unity poskytuje zásady správného řízení dat pro strukturovaná i nestrukturovaná data v cloudovém úložišti objektů. Viz Připojení do cloudového úložiště objektů pomocí katalogu Unity.

Zákazníci, kteří nepoužívají katalog Unity, musí nakonfigurovat připojení pomocí starších metod. Viz Konfigurace přístupu ke cloudovému úložišti objektů pro Azure Databricks.

Pokud chcete nakonfigurovat sítě pro cloudové úložiště objektů, přečtěte si téma Sítě.

Konfigurace připojení k externím datovým systémům

Databricks doporučuje několik možností konfigurace připojení k externím datovým systémům v závislosti na vašich potřebách. Následující tabulka obsahuje základní přehled těchto možností:

Možnost Popis
Federace Lakehouse Poskytuje přístup k datům jen pro čtení v podnikových datových systémech. Připojení konfigurace prostřednictvím katalogu Unity Na úrovni katalogu nebo schématu se synchronizují více tabulek s jednou konfigurací. Podívejte se , co je Federace Lakehouse.
Partner Připojení Využívá technologická partnerské řešení pro připojení k externím zdrojům dat a automatizaci ingestování dat do jezera. Některá řešení také zahrnují reverzní ETL a přímý přístup k datům lakehouse z externích systémů. Podívejte se, co je partner Databricks Připojení?
Ovladače Azure Databricks zahrnuje ovladače pro externí datové systémy v jednotlivých modulech Databricks Runtime. Volitelně můžete nainstalovat ovladače třetích stran pro přístup k datům v jiných systémech. Musíte nakonfigurovat připojení pro každou tabulku. Mezi ovladače patří přístup pro zápis. Viz Připojení k externím systémům.
JDBC Několik zahrnutých ovladačů pro externí systémy vychází z nativní podpory JDBC a možnost JDBC poskytuje rozšiřitelné možnosti konfigurace připojení k jiným systémům. Musíte nakonfigurovat připojení pro každou tabulku. Viz Dotazování databází pomocí JDBC.

Připojení ke streamovaným zdrojům dat

Azure Databricks poskytuje optimalizované konektory pro mnoho streamovaných datových systémů.

Pro všechny streamované zdroje dat musíte vygenerovat přihlašovací údaje, které poskytují přístup a načítají tyto přihlašovací údaje do Azure Databricks. Databricks doporučuje ukládat přihlašovací údaje pomocí tajných kódů, protože tajné kódy můžete používat pro všechny možnosti konfigurace a ve všech režimech přístupu.

Všechny datové konektory pro zdroje streamování podporují předávání přihlašovacích údajů pomocí možností při definování dotazů streamování. Viz Konfigurace streamovaných zdrojů dat.

Vyžádání přístupu ke zdrojům dat

V mnoha organizacích nemá většina uživatelů dostatečná oprávnění ke konfiguraci datových připojení v Azure Databricks nebo externích zdrojích dat.

Vaše organizace už možná nakonfigurovala přístup ke zdroji dat pomocí některého ze vzorů popsaných v článcích propojených z této stránky. Pokud má vaše organizace dobře definovaný proces pro vyžádání přístupu k datům, doporučuje Databricks tento proces sledovat.

Pokud si nejste jistí, jak získat přístup ke zdroji dat, může vám tento postup pomoct:

  1. Pomocí Průzkumníka katalogu můžete zobrazit tabulky a svazky, ke kterým máte přístup. Podívejte se, co je Průzkumník katalogu?
  2. Zeptejte se členů týmu nebo manažerů na zdroje dat, ke kterým mají přístup.
    • Většina organizací používá skupiny synchronizované ze svého zprostředkovatele identity (například: Okta nebo Microsoft Entra ID (dříve Azure Active Directory) ke správě oprávnění pro uživatele pracovního prostoru. Pokud mají ostatní členové vašeho týmu přístup ke zdrojům dat, ke kterým potřebujete přístup, požádejte správce pracovního prostoru, aby vám udělil přístup.
    • Pokud určitou tabulku, svazek nebo zdroj dat nakonfiguroval spolupracovník, měl by mít daný uživatel oprávnění k udělení přístupu k datům.
  3. Některé organizace konfigurují oprávnění pro přístup k datům prostřednictvím nastavení výpočetních clusterů a SQL Warehouse.
    • Přístup ke zdrojům dat se může lišit podle výpočetních prostředků.
    • Tvůrce výpočetních prostředků můžete zobrazit na kartě Výpočty . Požádejte autora o zdroje dat, které by měly být přístupné.