Megosztás a következőn keresztül:


Adatok felderítése

Az Azure Databricks olyan eszközöket és termékeket kínál, amelyek leegyszerűsítik a Databricks adatintelligencia-platformon keresztül elérhető adategységek felderítését. Ez a cikk véleményezett áttekintést nyújt arról, hogyan derítheti fel és tekintheti meg azokat az adatokat, amelyek már konfigurálva vannak a munkaterületen való hozzáférésre.

A szakasz témakörei az adatobjektumok és adatfájlok feltárására összpontosítanak. Ha olyan eszközökkel való munkával kapcsolatos információkat keres, mint a jegyzetfüzetek, az SQL-lekérdezések, a kódtárak és a modellek, tekintse meg a munkaterületen való navigálást.

Ha útmutatást keres az adathalmazok összesített statisztikáinak vagy a feltáró adatelemzéshez (EDA) kapcsolódó egyéb feladatokhoz való generálásával kapcsolatban, tekintse meg az Azure Databricks feltáró adatelemzése: Eszközök és technikák című témakört.

Hogyan derítheti fel az adategységeket?

Az Azure Databricks adatfelderítési eszközei az alábbi általános kategóriákba sorolhatók:

  • AI által támogatott elemzések, összegzés és keresés.
  • Kulcsszókeresés.
  • Katalógusfeltárás a felhasználói felületen.
  • Programozott lista és metaadatok feltárása.

Az adatfelderítési eszközök a Unity Catalog által szabályozott adatokra vannak optimalizálva. Előfordulhat, hogy a Unity Catalog-objektumokként nem regisztrált adategységek bizonyos módszerekkel nem észlelhetők.

Adatok keresése a felhasználói felületen

A Catalog Explorer eszközöket biztosít az adategységek feltárására és szabályozására. A Katalóguskezelőt a Katalógus ikon katalógus használatával érheti el a munkaterület oldalsávjában. Lásd: Mi az a Katalóguskezelő?.

A jegyzetfüzetek és az SQL-lekérdezésszerkesztő emellett katalógus-kezelőt is biztosítanak az adatbázis-objektumok felderítéséhez. A Katalógus ikonra kattintva kibonthatja vagy összecsukhatja a katalógus-kezelőt anélkül, hogy kilépne a kódszerkesztőből.

Miután felfedezett egy érdekes adathalmazt, az Elemzések lapon megtudhatja, hogyan használják az adatokat a munkaterületen. Lásd: Gyakori lekérdezések és táblák felhasználóinak megtekintése.

Adatok programozott feltárása

Az összes adatbázis-objektum parancsával SHOW felderítheti a Unity Catalogban regisztrált objektumokat. A fájlok listázásához használja a LIST parancsot, a %fs magic parancsot vagy a Databricks Utilitiest.

Lásd: Tárterület, adatfájlok és adatbázis-objektumok felfedezése.

Adatmegjegyzések áttekintése

A megjegyzések áttekintésével megismerheti a lakehouse-ban elérhető adathalmazok tartalmát. A megjegyzések beállíthatók adatobjektumokon, például katalógusokon, sémákon, táblákon és oszlopokon. A katalóguskezelőben vagy egy objektum parancsával megtekintheti a DESCRIBE megjegyzéseket.

A Katalóguskezelő AI által létrehozott megjegyzéseket adhat a táblákhoz, így az adategység-tulajdonosok egyszerűen áttekinthetik az adathalmazokat. Lásd: AI által létrehozott megjegyzések hozzáadása Unity Catalog-objektumokhoz.

A felhasználók a Katalóguskezelőben renderelt Markdown használatával is adhatnak megjegyzéseket táblákhoz és más adatbázis-objektumokhoz. Lásd: Megjegyzések hozzáadása adatokhoz és AI-eszközökhöz.

Táblák keresése a tóházban

Az Azure Databricks keresősávjának használatával megkeresheti a Unity Catalogban regisztrált táblákat. Kulcsszókeresést is végezhet, vagy szemantikai kereséssel megkeresheti a keresési lekérdezéshez kapcsolódó adathalmazokat vagy oszlopokat. A keresés csak olyan táblák eredményeit adja vissza, amelyek megtekintéséhez engedéllyel rendelkezik. A keresés áttekinti a táblaneveket, az oszlopneveket, a táblázat megjegyzéseit és az oszlop megjegyzéseit. Lásd: Munkaterület-objektumok keresése.