Sdílet prostřednictvím


Čtení tabulek v Databricks z klientů Delta

Tato stránka obsahuje přehled použití rozhraní Unity REST API pro přístup ke spravovaným a externím tabulkám katalogu Unity z externích klientů Delta. Pokud chcete vytvořit externí tabulky Delta z externích klientů, přečtěte si téma Vytvoření externích tabulek Delta z externích klientů.

Pomocí katalogu Iceberg REST můžete číst tabulky zaregistrované v katalogu Unity v Azure Databricks z podporovaných klientů Icebergu, včetně Apache Sparku a DuckDB.

Úplný seznam podporovaných integrací najdete v tématu Integrace katalogu Unity.

Spropitné

Informace o tom, jak číst data Azure Databricks pomocí Microsoft Fabric, najdete v tématu Použití Microsoft Fabric ke čtení dat registrovaných v katalogu Unity.

čtení a psaní pomocí rozhraní Unity REST API

Rozhraní Unity REST API poskytuje externím klientům přístup pro čtení k tabulkám registrovaným v katalogu Unity. Někteří klienti také podporují vytváření tabulek a zápis do existujících tabulek.

Konfigurace přístupu pomocí koncového bodu /api/2.1/unity-catalog.

Požadavky

Azure Databricks podporuje přístup rozhraní Unity REST API k tabulkám jako součást katalogu Unity. Abyste mohli tyto koncové body používat, musíte mít ve svém pracovním prostoru povolený katalog Unity. Následující typy tabulek mají nárok na čtení rozhraní Unity REST API:

  • Tabulky spravované Katalogem Unity
  • Externí tabulky Katalogu Unity

Abyste mohli nakonfigurovat přístup ke čtení objektů Databricks z klientů Delta pomocí rozhraní Unity REST API, musíte provést následující kroky konfigurace:

Čtení tabulek Delta pomocí Apache Sparku

Následuje příklad nastavení pro konfiguraci Apache Sparku pro čtení spravovaných a externích tabulek Delta katalogu Unity:

"spark.sql.extensions": "io.delta.sql.DeltaSparkSessionExtension",
"spark.sql.catalog.spark_catalog": "io.unitycatalog.spark.UCSingleCatalog",
"spark.sql.catalog.<uc-catalog-name>": "io.unitycatalog.spark.UCSingleCatalog",
"spark.sql.catalog.<uc-catalog-name>.uri": "<workspace-url>/api/2.1/unity-catalog",
"spark.sql.catalog.<uc-catalog-name>.token":"<token>",
"spark.sql.defaultCatalog":"<uc-catalog-name>"

Nahraďte následující proměnné:

  • <uc-catalog-name>: Název katalogu Unity, který obsahuje tabulky.
  • <workspace-url>: Adresa URL pracovního prostoru Azure Databricks.
  • <token>: PAT token pro hlavní subjekt konfigurující integraci.

Důležitý

Konkrétní konfigurace se liší v závislosti na typu cloudového úložiště objektů, které katalog zálohují. Další konfigurace najdete v dokumentaci ke katalogu OSS Unity .