Připojení k Dataiku
Dataiku je ucelená platforma AI pro přípravu dat, Mosaic AutoML a MLOps. Clustery Databricks SQL Warehouse a Azure Databricks můžete integrovat s Dataiku.
Připojení k Dataiku pomocí Partnerského připojení
Poznámka:
Partner Connect podporuje pouze sql warehouses pro Dataiku. Pokud chcete cluster připojit k Dataiku, připojte se k Dataiku ručně.
Pokud chcete připojit pracovní prostor Azure Databricks k Dataiku pomocí Partnerského připojení, postupujte takto:
Na bočním panelu klikněte na Partner Connect.
Klikněte na dlaždici partnera.
Poznámka:
Pokud má dlaždice Dataiku ikonu zaškrtnutí, správce už k připojení Dataiku k vašemu pracovnímu prostoru použil Partner Connect. Přejděte ke kroku 5. Partner používá e-mailovou adresu vašeho účtu Azure Databricks a vyzve vás, abyste se přihlásili ke stávajícímu účtu Dataiku.
V rozevíracím seznamu vyberte katalog a potom klikněte na Tlačítko Další.
Poznámka:
Pokud je váš pracovní prostor povolený katalogEm Unity, ale partner nepodporuje katalog Unity s Partner Connect, použije se výchozí katalog pracovního prostoru. Pokud váš pracovní prostor není povolený katalog Unity,
hive_metastore
použije se.V rozevíracím seznamu vyberte schéma a potom klikněte na přidat. Tento krok můžete opakovat a přidat více schémat.
Klikněte na tlačítko Další.
Partner Connect vytvoří ve vašem pracovním prostoru následující prostředky:
- Instanční objekt Azure Databricks s názvem
<PARTNER>_USER
. - Token pat azure Databricks přidružený k instančnímu objektu
<PARTNER>_USER
.
Partner Connect také uděluje instančnímu objektu
<PARTNER>_USER
následující oprávnění:- (Katalog Unity)
USE CATALOG
: Vyžaduje se pro interakci s objekty ve vybraném katalogu. - (Katalog Unity)
USE SCHEMA
: Uděluje možnost číst vámi vybraná schémata. - (Katalog Unity):
CREATE SCHEMA
: Uděluje možnost vytvářet schémata ve vybraném katalogu. - (Starší metastore Hive)
USAGE
: Vyžaduje se pro interakci s objekty v rámcihive_metastore
a vybraných schémat. - (Starší metastor Hive)
CREATE
: Uděluje možnost vytvořit schéma vhive_metastore
. - (Starší metastore Hive) READ_METADATA: Uděluje možnost číst metadata pro vybraná schémata.
- (Starší metastore Hive) SELECT: Uděluje možnost číst vybraná schémata.
- Instanční objekt Azure Databricks s názvem
Klikněte na tlačítko Další.
V poli E-mail se zobrazí e-mailová adresa vašeho účtu Azure Databricks. Dataiku používá tuto e-mailovou adresu k zobrazení výzvy k vytvoření nového partnerského účtu nebo přihlášení k existujícímu partnerskému účtu.
Klikněte na Připojit k Dataiku nebo se přihlaste.
Ve webovém prohlížeči se otevře nová karta, která zobrazuje web Dataiku.
Dokončete pokyny na obrazovce na webu Dataiku a vytvořte si zkušební účet Dataiku nebo se přihlaste ke svému stávajícímu účtu Dataiku.
Ruční připojení k Dataiku
Tato část popisuje, jak připojit existující SQL Warehouse nebo cluster v pracovním prostoru Azure Databricks k Dataiku ručně.
Poznámka:
Pro služby Databricks SQL Warehouse se můžete připojit k Dataiku pomocí nástroje Partner Connect a zjednodušit tak prostředí.
Požadavky
Před ručním připojením k Dataiku potřebujete následující:
Cluster nebo SQL Warehouse v pracovním prostoru Azure Databricks
- Referenční informace ke konfiguraci výpočetních prostředků
- Vytvořte SQL Warehouse.
Podrobnosti o připojení pro váš cluster nebo SQL Warehouse, konkrétně název hostitele serveru, port a hodnoty cesty HTTP.
- Získejte podrobnosti o připojení pro výpočetní prostředek Azure Databricks.
Osobní přístupový token Azure Databricks nebo token Microsoft Entra ID (dříve Azure Active Directory). Pokud chcete vytvořit osobní přístupový token, postupujte takto:
- V pracovním prostoru Azure Databricks klikněte na své uživatelské jméno Azure Databricks v horním panelu a pak v rozevíracím seznamu vyberte Nastavení .
- Klikněte na Vývojář.
- Vedle přístupových tokenů klikněte na Spravovat.
- Klikněte na Vygenerovat nový token.
- (Volitelné) Zadejte komentář, který vám pomůže identifikovat tento token v budoucnu a změnit výchozí životnost tokenu na 90 dnů. Pokud chcete vytvořit token bez životnosti (nedoporučuje se), nechte pole Životnost (dny) prázdné (prázdné).
- Klikněte na Vygenerovat.
- Zkopírujte zobrazený token do zabezpečeného umístění a klikněte na tlačítko Hotovo.
Poznámka:
Nezapomeňte zkopírovaný token uložit do zabezpečeného umístění. Nesdílejte svůj zkopírovaný token s ostatními. Pokud ztratíte zkopírovaný token, nemůžete tento úplně stejný token znovu vygenerovat. Místo toho musíte tento postup zopakovat, abyste vytvořili nový token. Pokud ztratíte zkopírovaný token nebo se domníváte, že došlo k ohrožení zabezpečení tokenu, databricks důrazně doporučuje tento token okamžitě odstranit z pracovního prostoru kliknutím na ikonu koše (Odvolat) vedle tokenu na stránce Přístupové tokeny .
Pokud v pracovním prostoru nemůžete vytvářet nebo používat tokeny, může to být proto, že správce pracovního prostoru zakázal tokeny nebo vám neudělil oprávnění k vytváření nebo používání tokenů. Projděte si správce pracovního prostoru nebo následující témata:
Poznámka:
Osvědčeným postupem při ověřování pomocí automatizovaných nástrojů, systémů, skriptů a aplikací doporučuje Databricks místo uživatelů pracovního prostoru používat tokeny patního přístupu, které patří instančním objektům . Pokud chcete vytvořit tokeny pro instanční objekty, přečtěte si téma Správa tokenů instančního objektu.
Postup připojení
Pokud se chcete k Dataiku připojit ručně, postupujte podle databricks v dokumentaci k Dataiku.
Další materiály
Prozkoumejte následující zdroje informací o Dataiku: