Adatok felderítése
Az Azure Databricks olyan eszközöket és termékeket kínál, amelyek leegyszerűsítik a Databricks adatintelligencia-platformon keresztül elérhető adategységek felderítését. Ez a cikk véleményezett áttekintést nyújt arról, hogyan derítheti fel és tekintheti meg azokat az adatokat, amelyek már konfigurálva vannak a munkaterületen való hozzáférésre.
- Az adatforrásokhoz való csatlakozásról a Csatlakozás adatforrásokhoz című témakörben olvashat.
- A Databricks Marketplace-en az adatokhoz való hozzáférésről további információt a Mi az a Databricks Marketplace?
A szakasz témakörei az adatobjektumok és adatfájlok feltárására összpontosítanak. Ha olyan eszközökkel való munkával kapcsolatos információkat keres, mint a jegyzetfüzetek, az SQL-lekérdezések, a kódtárak és a modellek, tekintse meg a munkaterületen való navigálást.
Ha útmutatást keres az adathalmazok összesített statisztikáinak vagy a feltáró adatelemzéshez (EDA) kapcsolódó egyéb feladatokhoz való generálásával kapcsolatban, tekintse meg az Azure Databricks feltáró adatelemzése: Eszközök és technikák című témakört.
Hogyan derítheti fel az adategységeket?
Az Azure Databricks adatfelderítési eszközei az alábbi általános kategóriákba sorolhatók:
- AI által támogatott elemzések, összegzés és keresés.
- Kulcsszókeresés.
- Katalógusfeltárás a felhasználói felületen.
- Programozott lista és metaadatok feltárása.
Az adatfelderítési eszközök a Unity Catalog által szabályozott adatokra vannak optimalizálva. Előfordulhat, hogy a Unity Catalog-objektumokként nem regisztrált adategységek bizonyos módszerekkel nem észlelhetők.
Adatok keresése a felhasználói felületen
A Catalog Explorer eszközöket biztosít az adategységek feltárására és szabályozására. A Katalóguskezelőt a katalógus használatával érheti el a munkaterület oldalsávjában. Lásd: Mi az a Katalóguskezelő?.
A jegyzetfüzetek és az SQL-lekérdezésszerkesztő emellett katalógus-kezelőt is biztosítanak az adatbázis-objektumok felderítéséhez. A Katalógus ikonra kattintva kibonthatja vagy összecsukhatja a katalógus-kezelőt anélkül, hogy kilépne a kódszerkesztőből.
Miután felfedezett egy érdekes adathalmazt, az Elemzések lapon megtudhatja, hogyan használják az adatokat a munkaterületen. Lásd: Gyakori lekérdezések és táblák felhasználóinak megtekintése.
Adatok programozott feltárása
Az összes adatbázis-objektum parancsával SHOW
felderítheti a Unity Catalogban regisztrált objektumokat. A fájlok listázásához használja a LIST
parancsot, a %fs
magic parancsot vagy a Databricks Utilitiest.
Lásd: Tárterület, adatfájlok és adatbázis-objektumok felfedezése.
Adatmegjegyzések áttekintése
A megjegyzések áttekintésével megismerheti a lakehouse-ban elérhető adathalmazok tartalmát. A megjegyzések beállíthatók adatobjektumokon, például katalógusokon, sémákon, táblákon és oszlopokon. A katalóguskezelőben vagy egy objektum parancsával megtekintheti a DESCRIBE
megjegyzéseket.
A Katalóguskezelő AI által létrehozott megjegyzéseket adhat a táblákhoz, így az adategység-tulajdonosok egyszerűen áttekinthetik az adathalmazokat. Lásd: AI által létrehozott megjegyzések hozzáadása Unity Catalog-objektumokhoz.
A felhasználók a Katalóguskezelőben renderelt Markdown használatával is adhatnak megjegyzéseket táblákhoz és más adatbázis-objektumokhoz. Lásd: Megjegyzések hozzáadása adatokhoz és AI-eszközökhöz.
Táblák keresése a tóházban
Az Azure Databricks keresősávjának használatával megkeresheti a Unity Catalogban regisztrált táblákat. Kulcsszókeresést is végezhet, vagy szemantikai kereséssel megkeresheti a keresési lekérdezéshez kapcsolódó adathalmazokat vagy oszlopokat. A keresés csak olyan táblák eredményeit adja vissza, amelyek megtekintéséhez engedéllyel rendelkezik. A keresés áttekinti a táblaneveket, az oszlopneveket, a táblázat megjegyzéseit és az oszlop megjegyzéseit. Lásd: Munkaterület-objektumok keresése.