Megosztás a következőn keresztül:


A munkaterület-objektumok bemutatása

Ez a cikk az Azure Databricks-munkaterület objektumainak magas szintű bemutatását ismerteti. Munkaterület-objektumokat létrehozhat, tekinthet meg és rendszerezhet a munkaterület böngészőben a különböző személyek között.

Megjegyzés a namimg-munkaterület eszközeiről

A munkaterület-objektum teljes neve az alapnevéből és a fájlkiterjesztéséből áll. A jegyzetfüzet fájlkiterjesztése .pylehet például , .sql, .scala, .rés a jegyzetfüzet nyelvétől és .ipynb formátumától függően.

Jegyzetfüzet-objektum létrehozásakor az alapnévnek és annak teljes nevének (a fájlkiterjesztéssel összefűzött alapnévnek) egyedinek kell lennie bármely munkaterületi mappában. Amikor elnevez egy objektumot, a Databricks ellenőrzi, hogy megfelel-e ennek a feltételnek a fájlkiterjesztés hozzáadásával, és ha a teljes név megegyezik a mappában lévő meglévő fájllal, a név nem engedélyezett, és új nevet kell választania a jegyzetfüzethez. Ha például megpróbál létrehozni egy Python-jegyzetfüzetet (Python-forrásformátumban) test ugyanabban a mappában, mint egy Python-fájl neve test.py, az nem lesz engedélyezve.

Klaszterek

Az Azure Databricks Adattudomány & mérnöki és Databricks Mozaik AI-fürtök egységes platformot biztosítanak a különböző használati esetekhez, például éles ETL-folyamatok futtatásához, streamelemzésekhez, alkalmi elemzésekhez és gépi tanuláshoz. A fürt az Azure Databricks számítási erőforrásának típusa. Más számítási erőforrástípusok közé tartoznak az Azure Databricks SQL-raktárak.

A fürtök kezelésével és használatával kapcsolatos részletes információkért lásd: Compute.

Notebook

A jegyzetfüzet egy webes felület a fájlokon és táblákon, vizualizációkon és elbeszélő szövegeken működő futtatható cellákat (parancsokat) tartalmazó dokumentumokhoz. A parancsok egymás után futtathatók, egy vagy több korábban futtatott parancs kimenetére hivatkozva.

A jegyzetfüzetek a kód Azure Databricksben való futtatásának egyik mechanizmusa. A másik mechanizmus a feladatok.

A jegyzetfüzetek kezelésével és használatával kapcsolatos részletes információkért lásd : Bevezetés a Databricks-jegyzetfüzetek használatába.

Munkahelyek

A feladatok a kód Azure Databricksben való futtatásának egyik mechanizmusa. A másik mechanizmus a jegyzetfüzetek.

A feladatok kezelésével és használatával kapcsolatos részletes információkért lásd: Munkafolyamatok ütemezése és vezénylése.

Könyvtárak

A kódtár külső vagy helyileg létrehozott kódot tesz elérhetővé a fürtökön futó jegyzetfüzetek és feladatok számára.

A kódtárak kezelésével és használatával kapcsolatos részletes információkért lásd : Könyvtárak.

Adat

Adatokat importálhat egy Azure Databricks-munkaterületre csatlakoztatott elosztott fájlrendszerbe, és dolgozhat velük az Azure Databricks-jegyzetfüzetekben és -fürtökben. Az Apache Spark-adatforrások széles választékával is hozzáférhet az adatokhoz.

Az adatok betöltésével kapcsolatos részletes információkért tekintse meg az adatok Databricks lakehouse-ba való betöltését ismertető témakört.

Fájlokat

Fontos

Ez a funkció a nyilvános előzetes verzióban érhető el.

A Databricks Runtime 11.3 LTS-ben és újabb verziókban tetszőleges fájlokat hozhat létre és használhat a Databricks-munkaterületen. A fájlok bármilyen fájltípust tartalmazhatnak. Néhány általános példa:

  • .py egyéni modulokban használt fájlok.
  • .md fájlokat, például README.md.
  • .csv vagy más kis adatfájlokat.
  • .txt Fájlokat.
  • Naplófájlok.

A fájlok használatáról további információt a Fájlok használata az Azure Databricksben című témakörben talál. A Databricks-jegyzetfüzetekkel végzett fejlesztés során a fájlok használatával a kód modulárissá alakításáról további információt a Kód megosztása a Databricks-jegyzetfüzetek között című témakörben talál .

Git-mappák

A Git-mappák olyan Azure Databricks-mappák, amelyek tartalma közösen van szinkronizálva egy távoli Git-adattárral. A Databricks Git-mappák használatával jegyzetfüzeteket fejleszthet az Azure Databricksben, és használhat egy távoli Git-adattárat az együttműködéshez és a verziókövetéshez.

Az adattárak használatáról további információt a Databricks Git-mappák Git-integrációjában talál.

Modellek

A modell az MLflow-modellregisztrációs adatbázisban regisztrált modellre vonatkozik. A Modellregisztrációs adatbázis egy központosított modelltároló, amely lehetővé teszi az MLflow-modellek teljes életciklusának kezelését. Időrendi modellkialakítást, modellverzió-verziót, fázisáttűnést, valamint modell- és modellverzió-széljegyzeteket és leírásokat biztosít.

A modellek kezelésével és használatával kapcsolatos részletes információkért lásd a Modell életciklusának kezelése a Unity Katalógusban című témakört.

Kísérletek

Az MLflow-kísérlet az MLflow gépi tanulási modell betanítási futásainak szervezeti és hozzáférés-vezérlési elsődleges egysége; az összes MLflow-futtatás egy kísérlethez tartozik. Minden kísérlet lehetővé teszi a futtatások vizualizálását, keresését és összehasonlítását, valamint futtatási összetevők vagy metaadatok letöltését más eszközök elemzéséhez.

A kísérletek kezelésével és használatával kapcsolatos részletes információkért lásd : Betanítási futtatások rendszerezése MLflow-kísérletekkel.

Lekérdezések

A lekérdezések olyan SQL-utasítások, amelyek lehetővé teszik az adatokkal való interakciót. További információ: Access és manage saved lekérdezések.

Irányítópultok

Az irányítópultok lekérdezési vizualizációk és kommentárok bemutatói. Lásd: Irányítópultok vagy örökölt irányítópultok.

Riasztások

A riasztások olyan értesítések, amelyek szerint egy lekérdezés által visszaadott mező elérte a küszöbértéket. További információ: Mik azok a Databricks SQL-riasztások?

Munkaterület-objektumokra mutató hivatkozások

A felhasználóknak korábban egyes Databricks API-k (%sh) elérési útelőtagját kellett tartalmazniuk/Workspace, mások esetében azonban nem (%runREST API-bemenetek).

A felhasználók mindenhol használhatnak munkaterületi útvonalakat az /Workspace előtaggal. Az előtag nélküli /Workspace elérési utakra mutató régi hivatkozások átirányítva lesznek, és továbbra is működnek. Javasoljuk, hogy minden munkaterület-elérési út rendelkezzen az előtaggal, /Workspace hogy megkülönböztesse őket a Kötet és a DBFS elérési útjaitól.

Az elérésiút-előtag konzisztens /Workspace viselkedésének előfeltétele a következő: A munkaterület gyökérszintjén nem lehet /Workspace mappa. Ha rendelkezik egy /Workspace gyökérszintű mappával, és engedélyezni szeretné ezt az UX-fejlesztést, törölje vagy nevezze át a /Workspace létrehozott mappát, és lépjen kapcsolatba az Azure Databricks-fiók csapatával.

Fájl, mappa vagy jegyzetfüzet URL-címének megosztása

Az Azure Databricks-munkaterületen a munkaterület fájljainak, jegyzetfüzeteinek és mappáinak URL-címei a következő formátumban vannak:

Munkaterület fájl URL-címei

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#files/<16-digit-object-ID>

Jegyzetfüzet URL-címei

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#notebook/<16-digit-object-ID>/command/<16-digit-command-ID>

Mappa (munkaterület és Git) URL-címei

  https://<databricks-instance>/browse/folders/<16-digit-ID>?o=<16-digit-workspace-ID>

Ezek a hivatkozások megszakadhatnak, ha az aktuális elérési út bármely mappája, fájlja vagy jegyzetfüzete Git-lekéréses paranccsal frissül, vagy ugyanazzal a névvel törlődik és újra létrejön. Létrehozhat azonban egy hivatkozást a munkaterület elérési útja alapján, amelyet más Databricks-felhasználókkal a megfelelő hozzáférési szinttel oszthat meg, ha az alábbi formátumú hivatkozásra módosítja:

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#workspace/<full-workspace-path-to-file-or-folder>

A mappákra, jegyzetfüzetekre és fájlokra mutató hivatkozásokat úgy oszthatja meg, hogy az URL-cím ?o=<16-digit-workspace-ID> minden elemét lecseréli a munkaterület gyökérkönyvtárában található fájl, mappa vagy jegyzetfüzet elérési útjára. Ha url-címet oszt meg egy mappában, távolítsa el /browse/folders/<16-digit-ID> az eredeti URL-címet is.

A fájl elérési útjának lekéréséhez nyissa meg a helyi menüt úgy, hogy a jobb gombbal a megosztani kívánt mappára, jegyzetfüzetre vagy fájlra kattint, majd válassza az URL/elérési út teljes elérési útja> másolása lehetőséget. Az imént másolt #workspace fájl elérési útjára elő van állítva, és fűzze hozzá az eredményül kapott sztringet a ?o=<16-digit-workspace-ID> fenti URL-formátumhoz.

Válassza ki a Másolás URL-címet, majd a Teljes elérési utat a munkaterület mappa helyi menüjéből.

1. url-címformázási példa: Mappa URL-címei

A munkaterület mappa URL-címének https://<databricks-instance>/browse/folders/1111111111111111?o=2222222222222222megosztásához távolítsa el a browse/folders/1111111111111111 részszúrást az URL-címből. Adja hozzá #workspace a megosztani kívánt mappa vagy munkaterület-objektum elérési útját.

Ebben az esetben a munkaterület elérési útja egy mappa. /Workspace/Users/user@example.com/team-git/notebooks Miután átmásolta a teljes elérési utat a munkaterületről, létrehozhatja a megosztható hivatkozást:

  https://<databricks-instance>/?o=2222222222222222#workspace/Workspace/Users/user@example.com/team-git/notebooks

2. példa URL-cím megfogalmazása: Jegyzetfüzet URL-címei

A jegyzetfüzet URL-címének https://<databricks-instance>/?o=1111111111111111#notebook/2222222222222222/command/3333333333333333megosztásához távolítsa el #notebook/2222222222222222/command/3333333333333333. Adja hozzá #workspace a mappa vagy munkaterület objektum elérési útját.

Ebben az esetben a munkaterület elérési útja egy jegyzetfüzetre mutat. /Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook Miután átmásolta a teljes elérési utat a munkaterületről, létrehozhatja a megosztható hivatkozást:

  https://<databricks-instance>/?o=1111111111111111#workspace/Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook

Most már stabil URL-cím áll rendelkezésére a megosztani kívánt fájlhoz, mappához vagy jegyzetfüzethez! Az URL-címekről és az azonosítókról további információt a munkaterület-objektumok azonosítóinak lekérése című témakörben talál.