A munkaterület-objektumok bemutatása
Ez a cikk az Azure Databricks-munkaterület objektumainak magas szintű bemutatását ismerteti. Munkaterület-objektumokat létrehozhat, tekinthet meg és rendszerezhet a munkaterület böngészőben a különböző személyek között.
Megjegyzés a namimg-munkaterület eszközeiről
A munkaterület-objektum teljes neve az alapnevéből és a fájlkiterjesztéséből áll. A jegyzetfüzet fájlkiterjesztése .py
lehet például , .sql
, .scala
, .r
és a jegyzetfüzet nyelvétől és .ipynb
formátumától függően.
Jegyzetfüzet-objektum létrehozásakor az alapnévnek és annak teljes nevének (a fájlkiterjesztéssel összefűzött alapnévnek) egyedinek kell lennie bármely munkaterületi mappában. Amikor elnevez egy objektumot, a Databricks ellenőrzi, hogy megfelel-e ennek a feltételnek a fájlkiterjesztés hozzáadásával, és ha a teljes név megegyezik a mappában lévő meglévő fájllal, a név nem engedélyezett, és új nevet kell választania a jegyzetfüzethez. Ha például megpróbál létrehozni egy Python-jegyzetfüzetet (Python-forrásformátumban) test
ugyanabban a mappában, mint egy Python-fájl neve test.py
, az nem lesz engedélyezve.
Klaszterek
Az Azure Databricks Adattudomány & mérnöki és Databricks Mozaik AI-fürtök egységes platformot biztosítanak a különböző használati esetekhez, például éles ETL-folyamatok futtatásához, streamelemzésekhez, alkalmi elemzésekhez és gépi tanuláshoz. A fürt az Azure Databricks számítási erőforrásának típusa. Más számítási erőforrástípusok közé tartoznak az Azure Databricks SQL-raktárak.
A fürtök kezelésével és használatával kapcsolatos részletes információkért lásd: Compute.
Notebook
A jegyzetfüzet egy webes felület a fájlokon és táblákon, vizualizációkon és elbeszélő szövegeken működő futtatható cellákat (parancsokat) tartalmazó dokumentumokhoz. A parancsok egymás után futtathatók, egy vagy több korábban futtatott parancs kimenetére hivatkozva.
A jegyzetfüzetek a kód Azure Databricksben való futtatásának egyik mechanizmusa. A másik mechanizmus a feladatok.
A jegyzetfüzetek kezelésével és használatával kapcsolatos részletes információkért lásd : Bevezetés a Databricks-jegyzetfüzetek használatába.
Munkahelyek
A feladatok a kód Azure Databricksben való futtatásának egyik mechanizmusa. A másik mechanizmus a jegyzetfüzetek.
A feladatok kezelésével és használatával kapcsolatos részletes információkért lásd: Munkafolyamatok ütemezése és vezénylése.
Könyvtárak
A kódtár külső vagy helyileg létrehozott kódot tesz elérhetővé a fürtökön futó jegyzetfüzetek és feladatok számára.
A kódtárak kezelésével és használatával kapcsolatos részletes információkért lásd : Könyvtárak.
Adat
Adatokat importálhat egy Azure Databricks-munkaterületre csatlakoztatott elosztott fájlrendszerbe, és dolgozhat velük az Azure Databricks-jegyzetfüzetekben és -fürtökben. Az Apache Spark-adatforrások széles választékával is hozzáférhet az adatokhoz.
Az adatok betöltésével kapcsolatos részletes információkért tekintse meg az adatok Databricks lakehouse-ba való betöltését ismertető témakört.
Fájlokat
Fontos
Ez a funkció a nyilvános előzetes verzióban érhető el.
A Databricks Runtime 11.3 LTS-ben és újabb verziókban tetszőleges fájlokat hozhat létre és használhat a Databricks-munkaterületen. A fájlok bármilyen fájltípust tartalmazhatnak. Néhány általános példa:
.py
egyéni modulokban használt fájlok..md
fájlokat, példáulREADME.md
..csv
vagy más kis adatfájlokat..txt
Fájlokat.- Naplófájlok.
A fájlok használatáról további információt a Fájlok használata az Azure Databricksben című témakörben talál. A Databricks-jegyzetfüzetekkel végzett fejlesztés során a fájlok használatával a kód modulárissá alakításáról további információt a Kód megosztása a Databricks-jegyzetfüzetek között című témakörben talál .
Git-mappák
A Git-mappák olyan Azure Databricks-mappák, amelyek tartalma közösen van szinkronizálva egy távoli Git-adattárral. A Databricks Git-mappák használatával jegyzetfüzeteket fejleszthet az Azure Databricksben, és használhat egy távoli Git-adattárat az együttműködéshez és a verziókövetéshez.
Az adattárak használatáról további információt a Databricks Git-mappák Git-integrációjában talál.
Modellek
A modell az MLflow-modellregisztrációs adatbázisban regisztrált modellre vonatkozik. A Modellregisztrációs adatbázis egy központosított modelltároló, amely lehetővé teszi az MLflow-modellek teljes életciklusának kezelését. Időrendi modellkialakítást, modellverzió-verziót, fázisáttűnést, valamint modell- és modellverzió-széljegyzeteket és leírásokat biztosít.
A modellek kezelésével és használatával kapcsolatos részletes információkért lásd a Modell életciklusának kezelése a Unity Katalógusban című témakört.
Kísérletek
Az MLflow-kísérlet az MLflow gépi tanulási modell betanítási futásainak szervezeti és hozzáférés-vezérlési elsődleges egysége; az összes MLflow-futtatás egy kísérlethez tartozik. Minden kísérlet lehetővé teszi a futtatások vizualizálását, keresését és összehasonlítását, valamint futtatási összetevők vagy metaadatok letöltését más eszközök elemzéséhez.
A kísérletek kezelésével és használatával kapcsolatos részletes információkért lásd : Betanítási futtatások rendszerezése MLflow-kísérletekkel.
Lekérdezések
A lekérdezések olyan SQL-utasítások, amelyek lehetővé teszik az adatokkal való interakciót. További információ: Access és manage saved lekérdezések.
Irányítópultok
Az irányítópultok lekérdezési vizualizációk és kommentárok bemutatói. Lásd: Irányítópultok vagy örökölt irányítópultok.
Riasztások
A riasztások olyan értesítések, amelyek szerint egy lekérdezés által visszaadott mező elérte a küszöbértéket. További információ: Mik azok a Databricks SQL-riasztások?
Munkaterület-objektumokra mutató hivatkozások
A felhasználóknak korábban egyes Databricks API-k (%sh
) elérési útelőtagját kellett tartalmazniuk/Workspace
, mások esetében azonban nem (%run
REST API-bemenetek).
A felhasználók mindenhol használhatnak munkaterületi útvonalakat az /Workspace
előtaggal. Az előtag nélküli /Workspace
elérési utakra mutató régi hivatkozások átirányítva lesznek, és továbbra is működnek. Javasoljuk, hogy minden munkaterület-elérési út rendelkezzen az előtaggal, /Workspace
hogy megkülönböztesse őket a Kötet és a DBFS elérési útjaitól.
Az elérésiút-előtag konzisztens /Workspace
viselkedésének előfeltétele a következő: A munkaterület gyökérszintjén nem lehet /Workspace
mappa. Ha rendelkezik egy /Workspace
gyökérszintű mappával, és engedélyezni szeretné ezt az UX-fejlesztést, törölje vagy nevezze át a /Workspace
létrehozott mappát, és lépjen kapcsolatba az Azure Databricks-fiók csapatával.
Fájl, mappa vagy jegyzetfüzet URL-címének megosztása
Az Azure Databricks-munkaterületen a munkaterület fájljainak, jegyzetfüzeteinek és mappáinak URL-címei a következő formátumban vannak:
Munkaterület fájl URL-címei
https://<databricks-instance>/?o=<16-digit-workspace-ID>#files/<16-digit-object-ID>
Jegyzetfüzet URL-címei
https://<databricks-instance>/?o=<16-digit-workspace-ID>#notebook/<16-digit-object-ID>/command/<16-digit-command-ID>
Mappa (munkaterület és Git) URL-címei
https://<databricks-instance>/browse/folders/<16-digit-ID>?o=<16-digit-workspace-ID>
Ezek a hivatkozások megszakadhatnak, ha az aktuális elérési út bármely mappája, fájlja vagy jegyzetfüzete Git-lekéréses paranccsal frissül, vagy ugyanazzal a névvel törlődik és újra létrejön. Létrehozhat azonban egy hivatkozást a munkaterület elérési útja alapján, amelyet más Databricks-felhasználókkal a megfelelő hozzáférési szinttel oszthat meg, ha az alábbi formátumú hivatkozásra módosítja:
https://<databricks-instance>/?o=<16-digit-workspace-ID>#workspace/<full-workspace-path-to-file-or-folder>
A mappákra, jegyzetfüzetekre és fájlokra mutató hivatkozásokat úgy oszthatja meg, hogy az URL-cím ?o=<16-digit-workspace-ID>
minden elemét lecseréli a munkaterület gyökérkönyvtárában található fájl, mappa vagy jegyzetfüzet elérési útjára. Ha url-címet oszt meg egy mappában, távolítsa el /browse/folders/<16-digit-ID>
az eredeti URL-címet is.
A fájl elérési útjának lekéréséhez nyissa meg a helyi menüt úgy, hogy a jobb gombbal a megosztani kívánt mappára, jegyzetfüzetre vagy fájlra kattint, majd válassza az URL/elérési út teljes elérési útja> másolása lehetőséget. Az imént másolt #workspace
fájl elérési útjára elő van állítva, és fűzze hozzá az eredményül kapott sztringet a ?o=<16-digit-workspace-ID>
fenti URL-formátumhoz.
1. url-címformázási példa: Mappa URL-címei
A munkaterület mappa URL-címének https://<databricks-instance>/browse/folders/1111111111111111?o=2222222222222222
megosztásához távolítsa el a browse/folders/1111111111111111
részszúrást az URL-címből. Adja hozzá #workspace
a megosztani kívánt mappa vagy munkaterület-objektum elérési útját.
Ebben az esetben a munkaterület elérési útja egy mappa. /Workspace/Users/user@example.com/team-git/notebooks
Miután átmásolta a teljes elérési utat a munkaterületről, létrehozhatja a megosztható hivatkozást:
https://<databricks-instance>/?o=2222222222222222#workspace/Workspace/Users/user@example.com/team-git/notebooks
2. példa URL-cím megfogalmazása: Jegyzetfüzet URL-címei
A jegyzetfüzet URL-címének https://<databricks-instance>/?o=1111111111111111#notebook/2222222222222222/command/3333333333333333
megosztásához távolítsa el #notebook/2222222222222222/command/3333333333333333
. Adja hozzá #workspace
a mappa vagy munkaterület objektum elérési útját.
Ebben az esetben a munkaterület elérési útja egy jegyzetfüzetre mutat. /Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook
Miután átmásolta a teljes elérési utat a munkaterületről, létrehozhatja a megosztható hivatkozást:
https://<databricks-instance>/?o=1111111111111111#workspace/Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook
Most már stabil URL-cím áll rendelkezésére a megosztani kívánt fájlhoz, mappához vagy jegyzetfüzethez! Az URL-címekről és az azonosítókról további információt a munkaterület-objektumok azonosítóinak lekérése című témakörben talál.