Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Databricks poskytuje sadu nástrojů a produktů, které zjednodušují zjišťování datových prostředků, které jsou přístupné prostřednictvím platformy Databricks Data Intelligence Platform. Tento článek obsahuje názorný přehled toho, jak můžete zjistit a zobrazit náhled dat, která už jsou nakonfigurovaná pro přístup ve vašem pracovním prostoru.
- Pokud se chcete připojit ke zdrojům dat, přečtěte si téma Připojení ke zdrojům dat a externím službám.
- Informace o získání přístupu k datům na Webu Databricks Marketplace najdete v tématu Co je Databricks Marketplace?.
Témata v této části se zaměřují na zkoumání datových objektů a datových souborů. Pokud hledáte informace o práci s prostředky, jako jsou poznámkové bloky, dotazy SQL, knihovny a modely, podívejte se na uživatelské rozhraní pracovního prostoru.
Pokud hledáte pokyny k generování souhrnných statistik pro datové sady nebo jiné úlohy spojené s průzkumnou analýzou dat (EDA), přečtěte si téma Průzkumné analýzy dat v Azure Databricks: Nástroje a techniky.
Jak můžete objevit datová aktiva?
Nástroje pro zjišťování dat v Azure Databricks spadají do následujících obecných kategorií:
- Přehledy, souhrny a vyhledávání s asistencí umělé inteligence
- Hledání klíčových slov
- Zkoumání katalogu pomocí uživatelského rozhraní
- Programatické výpisy a zkoumání metadat
Nástroje pro zjišťování dat jsou optimalizované pro data, která se řídí katalogem Unity. Datové prostředky, které nebyly registrovány jako objekty katalogu Unity, nemusí být zjistitelné pomocí některých z těchto přístupů.
Vyhledání dat pomocí uživatelského rozhraní
Průzkumník katalogu poskytuje nástroje pro zkoumání a řízení datových prostředků. K Průzkumníku katalogu se dostanete pomocí Katalog na bočním panelu pracovního prostoru Podívejte se na Co je Průzkumník katalogu?
Poznámkové bloky a editor dotazů SQL také poskytují navigátor katalogu pro zkoumání databázových objektů. Kliknutím na ikonu Katalogu v těchto rozhraních rozbalíte nebo sbalíte navigátor katalogu, aniž byste opustili editor kódu.
Jakmile zjistíte datovou sadu, která vás zajímá, můžete pomocí karty Přehledy zjistit, jak se data používají ve vašem pracovním prostoru. Viz Zobrazení častých dotazů a uživatelů tabulky.
Prozkoumat data programově
Můžete použít příkaz SHOW pro všechny databázové objekty, abyste zjistili prostředky registrované v katalogu Unity. Použijte příkaz LIST, příkaz %fs magic nebo nástroje Databricks k výpisu souborů.
Viz Prozkoumání úložiště a vyhledání datových souborů a Prozkoumání databázových objektů.
Kontrola komentářů k datům
Komentáře si můžete prohlédnout, abyste se dozvěděli o obsahu datových sad dostupných ve vašem jezeře. Komentáře lze nastavit u datových objektů, včetně katalogů, schémat, tabulek a sloupců. Komentáře můžete zobrazit v Průzkumníku katalogu nebo pomocí DESCRIBE příkazu pro objekt.
Průzkumník katalogu může poskytovat komentáře generované AI pro tabulky, což vlastníkům datových prostředků usnadňuje poskytování bohatého přehledu datových sad. Viz Přidání komentářů generovaných AI do objektů katalogu Unity.
Uživatelé můžou také volitelně poskytnout komentáře k tabulkám a dalším databázovým objektům pomocí markdownu, který se v Průzkumníku katalogu vykresluje. Viz Přidání komentářů k datům a prostředkům AI.
Hledání tabulek v jezeře
Vyhledávací panel v Azure Databricks můžete použít k vyhledání tabulek zaregistrovaných v katalogu Unity. Vyhledávání klíčových slov můžete provést nebo použít sémantické vyhledávání k vyhledání datových sad nebo sloupců, které souvisejí s vaším vyhledávacím dotazem. Hledání vrací jenom výsledky pro tabulky, které máte oprávnění k zobrazení. Prohledávat názvy tabulek, názvy sloupců, komentáře k tabulkám a komentáře ke sloupcům. Viz Hledání objektů pracovního prostoru.