Microsoft Fabric-jegyzetfüzetek használata
A Microsoft Fabric-jegyzetfüzet az Apache Spark-feladatok és gépi tanulási kísérletek fejlesztésének elsődleges kódeleme. Ez egy webes interaktív felület, amelyet adattudósok és adatszakértők használnak a gazdag vizualizációk és Markdown-szövegek előnyeit kihasználó kód írásához. Az adatmérnökök kódot írnak az adatbetöltéshez, az adatok előkészítéséhez és az adatátalakításhoz. Az adattudósok jegyzetfüzeteket is használnak gépi tanulási megoldások létrehozásához, beleértve a kísérletek és modellek létrehozását, a modellkövetést és az üzembe helyezést.
Hálójegyzetfüzetekkel a következőket teheti:
- Első lépések a nulla beállítási munkával.
- Egyszerűen feltárhatja és feldolgozhatja az adatokat intuitív, alacsony kódszámú felhasználói felülettel.
- Az adatok védelme a beépített vállalati biztonsági funkciókkal.
- Adatok elemzése nyers formátumok (CSV, txt, JSON stb.), feldolgozott fájlformátumok (parquet, Delta Lake stb.) között, hatékony Spark-képességek használatával.
- Legyen hatékony a bővített szerzői képességekkel és a beépített adatvizualizációval.
Ez a cikk bemutatja, hogyan használhat jegyzetfüzeteket az adatelemzési és adatelemzési szolgáltatásokban.
A jegyzetfüzet futtatásának biztonsági környezete
A jegyzetfüzetek végrehajtását három különböző módon lehet aktiválni a Fabricben, teljes rugalmassággal, hogy megfeleljen a különböző forgatókönyveknek:
- Interaktív futtatás: A felhasználó manuálisan aktiválja a végrehajtást a különböző UX-bejegyzéseken keresztül, vagy meghívja a REST API-t. A végrehajtás az aktuális felhasználó biztonsági környezetében futna.
- Futtatás folyamattevékenységként: A végrehajtás a Fabric Data Factory-folyamatból indul ki. A részletes lépéseket a jegyzetfüzettevékenységben találja. A végrehajtás a folyamat tulajdonosának biztonsági környezetében futna.
- Ütemező: A végrehajtás egy ütemezőtervből indul ki. A végrehajtás annak a felhasználónak a biztonsági környezetében futna, aki beállítja/frissíti az ütemezőtervet.
A különböző biztonsági környezettel rendelkező végrehajtási lehetőségek rugalmassága lehetővé teszi a különböző forgatókönyvek és követelmények teljesítését, de azt is megköveteli, hogy a jegyzetfüzet tervezésekor és fejlesztésekor tisztában kell lennie a biztonsági környezettel, különben az váratlan viselkedést és bizonyos biztonsági problémákat okozhat.
A jegyzetfüzet első létrehozásakor megjelenik egy figyelmeztető üzenet, amely emlékezteti a kód ellenőrzés nélküli futtatásának kockázatára.
Íme néhány ajánlott eljárás a biztonsági problémák elkerüléséhez:
- Mielőtt manuálisan futtatja a jegyzetfüzetet, nyissa meg a Jegyzetfüzet beállítást, és ellenőrizze a Részletek szakaszt a Névjegy panelen a módosítás frissítéséhez, győződjön meg arról, hogy a legújabb módosítással rendben van.
- Mielőtt jegyzetfüzet-tevékenységet ad egy folyamathoz, nyissa meg a Jegyzetfüzet beállítást, és ellenőrizze a Névjegy panel Részletes szakaszát a módosítás frissítéséhez, győződjön meg arról, hogy a legutóbbi módosítással rendben van. Ha nem biztos a legutóbbi módosításban, nyissa meg a jegyzetfüzetet, hogy áttekintse a módosítást, mielőtt hozzáadja a folyamathoz.
- Az ütemezőcsomag frissítése előtt nyissa meg a Jegyzetfüzet beállítást, és ellenőrizze a Részletek szakaszt a Névjegy panelen a módosítás frissítéséhez, győződjön meg arról, hogy a legújabb módosítással rendben van. Ha nem biztos a legújabb módosításban, nyissa meg a jegyzetfüzetet, hogy áttekintse a módosítást az ütemezőcsomag frissítése előtt.
- A biztonsági probléma elkerülése érdekében különítse el a munkaterületet különböző fázisokra (fejlesztés, tesztelés, fejlesztés), és szabályozza a különböző fázisok elérését. Csak azt a felhasználót adja hozzá a próbaszakaszhoz, akiben megbízik.
Jegyzetfüzetek létrehozása
Létrehozhat egy új jegyzetfüzetet, vagy importálhat egy meglévő jegyzetfüzetet.
Új jegyzetfüzet létrehozása
A szokásos Hálóelem-létrehozási folyamatokhoz hasonlóan egyszerűen létrehozhat egy új jegyzetfüzetet a Háló adatmérnök kezdőlapjáról, a munkaterület Új lehetőségéből vagy a Létrehozási központból.
Meglévő jegyzetfüzetek importálása
Egy vagy több meglévő jegyzetfüzetet importálhat a helyi számítógépről egy Háló munkaterületre a adatmérnök vagy a Adattudomány kezdőlapjáról. A hálójegyzetfüzetek felismerik a standard Jupyter Notebook .ipynb fájlokat és a forrásfájlokat, például .py, .scala és .sql, és ennek megfelelően hoznak létre új jegyzetfüzetelemeket.
Jegyzetfüzet exportálása
A jegyzetfüzetet más szabványos formátumokba is exportálhatja. A Synapse-jegyzetfüzet exportálható a következőbe:
- A Jupyter-jegyzetfüzetekhez használt standard jegyzetfüzetfájl (.ipynb).
- Egy HTML-fájl (.html), amely közvetlenül a böngészőből nyitható meg.
- Python-fájl (.py).
- Latex-fájl (.tex).
Jegyzetfüzet mentése
A Fabricben a jegyzetfüzetek alapértelmezés szerint automatikusan mentésre kerülnek a megnyitás és szerkesztés után; nem kell aggódnia a kódmódosítások elvesztése miatt. A Másolat mentése parancsot is használhatja egy másik példány klónozásához az aktuális munkaterületen vagy egy másik munkaterületen.
Ha inkább manuálisan szeretne menteni egy jegyzetfüzetet, váltson a Manuális mentés beállításra, hogy a jegyzetfüzetelem egy helyi ága legyen, majd mentse a módosításokat a Mentés vagy a CTRL+s billentyűkombinációval.
Manuális mentési módra is válthat a Szerkesztés –>Mentési beállítások –>Manuális lehetőség kiválasztásával. Ha be szeretné kapcsolni a jegyzetfüzet egy helyi ágát, majd manuálisan menteni, válassza a Mentés vagy a Ctrl+s billentyűparancsot.
Tóházak és jegyzetfüzetek csatlakoztatása
A hálójegyzetfüzetek mostantól támogatják a lakehouse-okkal való szoros interakciót; a Lakehouse Explorerből egyszerűen hozzáadhat egy új vagy meglévő tóházat.
A Lakehouse Explorerben navigálhat a különböző tóházakhoz, és a rögzítéssel beállíthatja az egyik tóházat alapértelmezettként. Az alapértelmezett beállítás ezután a futtatókörnyezet munkakönyvtárához van csatlakoztatva, és helyi elérési út használatával olvashat vagy írhat az alapértelmezett lakehouse-ba.
Feljegyzés
Az új lakehouse rögzítése vagy az alapértelmezett lakehouse átnevezése után újra kell indítania a munkamenetet.
Tóház hozzáadása vagy eltávolítása
Ha a tóház neve melletti X ikont választja, az eltávolítja a jegyzetfüzet lapról, de a lakehouse elem továbbra is létezik a munkaterületen.
Válassza a Lakehouse hozzáadása lehetőséget, ha további tóházakat szeretne hozzáadni a jegyzetfüzethez egy meglévő hozzáadásával vagy egy új tóház létrehozásával.
Lakehouse-fájl felfedezése
A Lake nézet Táblák és fájlok szakaszában lévő almappák és fájlok a lakehouse-lista és a jegyzetfüzet tartalma közötti tartalomterületen jelennek meg. A tartalomterület frissítéséhez válasszon ki különböző mappákat a Táblák és fájlok szakaszban.
Mappa- és fájlműveletek
Ha jobb egérkattintással kiválaszt egy fájlt (.csv, .parquet, .txt, .jpg, .png stb.), a Spark vagy a Pandas API használatával betöltheti az adatokat. A rendszer létrehoz egy új kódcellát, és beszúrja a fókuszcella alá.
A kijelölt fájltól vagy mappától eltérő formátumú elérési utat egyszerűen másolhat, és használhatja a megfelelő elérési utat a kódban.
Jegyzetfüzet-erőforrások
A jegyzetfüzet erőforrás-kezelője Unix-szerű fájlrendszert biztosít a mappák és fájlok kezeléséhez. Írható fájlrendszerterületet biztosít, ahol kis méretű fájlokat, például kódmodulokat, szemantikai modelleket és képeket tárolhat. A jegyzetfüzetben lévő kóddal egyszerűen elérheti őket, mintha a helyi fájlrendszerrel dolgozik.
Ez a beépített mappa minden jegyzetfüzetpéldányhoz egy előre definiált rendszermappa. Legfeljebb 500 MB tárterületet őriz meg az aktuális jegyzetfüzet függőségeinek tárolásához. Ezek a jegyzetfüzet-erőforrások fő képességei:
- Használhat olyan gyakori műveleteket, mint a létrehozás/törlés, a feltöltés/letöltés, az húzás,az átnevezés, a duplikálás és a keresés a felhasználói felületen keresztül.
- Relatív útvonalakat is használhat, például
builtin/YourData.txt
gyors feltáráshoz. Amssparkutils.nbResPath
metódus segít a teljes elérési út megírásában. - Az érvényesített adatokat egyszerűen áthelyezheti egy tóházba az Írás a lakehouse-ba lehetőséggel. A Fabric beágyazott rich code-kódrészleteket a gyakori fájltípusokhoz, amelyek segítenek a gyors kezdésben.
- Ezek az erőforrások a referenciajegyzetfüzet-futtatási esethez is elérhetők a következőn keresztül
mssparkutils.notebook.run()
: .
Feljegyzés
- A Fabric jelenleg támogatja bizonyos fájltípusok feltöltését a felhasználói felületen keresztül, például .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg és .xlsx fájlokat. A beépített mappába olyan fájltípusokkal írhat, amelyek nem szerepelnek a listában kóddal, a Fabric-jegyzetfüzetek azonban nem támogatják a kódrészletek nem támogatott fájltípusokon történő generálásához.
- Minden fájlméretnek 50 MB-nál kisebbnek kell lennie, és a beépített mappa összesen legfeljebb 100 fájl-/mappapéldányt tesz lehetővé.
- Ha ezt használja
mssparkutils.notebook.run()
, használja amssparkutils.nbResPath
parancsot a céljegyzetfüzet-erőforrás eléréséhez. A "builtin/" relatív elérési út mindig a gyökérjegyzetfüzet beépített mappájára mutat.
Együttműködés jegyzetfüzetben
A Háló jegyzetfüzet egy együttműködési elem, amely támogatja, hogy több felhasználó szerkessze ugyanazt a jegyzetfüzetet.
Amikor megnyit egy jegyzetfüzetet, alapértelmezés szerint a közös szerkesztési módot adja meg, és minden jegyzetfüzetszerkesztés automatikusan megtörténik. Ha munkatársai egyszerre nyitják meg ugyanazt a jegyzetfüzetet, láthatja a profiljukat, futtathatják a kimenetet, a kurzorjelzőt, a kijelölésjelzőt és a szerkesztési nyomkövetést. Az együttműködési funkciók használatával könnyedén elvégezheti a párok programozását, a távoli hibakeresést és az oktatói forgatókönyveket.
Jegyzetfüzet megosztása
A jegyzetfüzetek megosztása kényelmes módja a csapattagokkal való együttműködésnek. A jogosult munkaterületi szerepkörök alapértelmezés szerint megtekinthetik vagy szerkeszthetik/futtathatják a jegyzetfüzeteket. Megoszthat egy jegyzetfüzetet megadott engedélyekkel.
Válassza a Megosztás lehetőséget a jegyzetfüzet eszköztárán.
Válassza ki a jegyzetfüzetet megtekintő személyek megfelelő kategóriáját. Kiválaszthatja a címzettek megosztási, szerkesztési vagy futtatási engedélyeit.
Az Alkalmaz lehetőség kiválasztása után közvetlenül is elküldheti a jegyzetfüzetet, vagy átmásolhatja a hivatkozást másoknak. A címzettek ezután megnyithatják a jegyzetfüzetet az engedélyszintjüknek megfelelő nézettel.
A jegyzetfüzet engedélyeinek további kezeléséhez válassza a Munkaterület elemlista További lehetőségek lehetőséget>, majd az Engedélyek kezelése lehetőséget. Ezen a képernyőn frissítheti a meglévő jegyzetfüzet-hozzáférést és -engedélyeket.
Kódcella megjegyzése
A kommentelés egy másik hasznos funkció az együttműködésen alapuló forgatókönyvek esetében. A Fabric jelenleg támogatja a cellaszintű megjegyzések hozzáadását.
A Megjegyzések panel megnyitásához válassza a jegyzetfüzet eszköztárának Megjegyzések gombját vagy a cella megjegyzésjelzőt.
Jelöljön ki kódot a kódcellában, válassza az Új lehetőséget a Megjegyzések panelen, adjon hozzá megjegyzéseket, majd a Mentéshez válassza a Megjegyzés közzététele lehetőséget.
Ha szüksége van rájuk, keresse meg a Megjegyzés szerkesztése, a Szál feloldása és a Szál törlése lehetőséget a megjegyzés melletti További lehetőség kiválasztásával.
Mások címkézése megjegyzésben
A "címkézés" azt jelenti, hogy megemlíti és értesíti a felhasználót egy megjegyzésszálban, és hatékonyan fejleszti az együttműködést a konkrétumok alapján.
Jelöljön ki egy kódszakaszt egy cellában, és adjon meg egy megjegyzésszálat.
Adja meg a felhasználónevet, és válassza ki a megfelelőt a javaslati listában, ha meg szeretne említeni valakit egy adott szakaszról való vita céljából.
Ossza meg az elemzéseket, és tegye közzé őket.
Ekkor egy e-mail-értesítés aktiválódik, és a felhasználó a Megjegyzések megnyitása hivatkozásra kattintva gyorsan megtalálhatja ezt a cellát.
Emellett engedélyezze és konfigurálja a felhasználók engedélyeit, amikor olyan valakit címkéz, aki nem rendelkezik hozzáféréssel, biztosítva, hogy a kódegységek megfelelően legyenek kezelve.
Feljegyzés
Megjegyzéselem esetén a címkézett felhasználó többé nem kap e-mail értesítést, ha egy órán belül frissíti a megjegyzést. De e-mailben értesítést küld az új címkézett felhasználónak.
Jegyzetfüzet mód váltása
A hálójegyzetfüzetek két módot támogatnak, amelyek között egyszerűen válthat: Szerkesztési és Megtekintési mód.
- Szerkesztési mód: Szerkesztheti és futtathatja a cellákat, és együttműködhet másokkal a jegyzetfüzetben.
- Megtekintési mód: Csak a jegyzetfüzet cellatartalma, kimenete és megjegyzései tekinthetők meg. A jegyzetfüzetet módosító összes művelet le van tiltva.