Sdílet prostřednictvím


Jak používat poznámkové bloky Microsoft Fabric

Poznámkový blok Microsoft Fabric je primární položkou kódu pro vývoj úloh Apache Sparku a experimentů strojového učení. Jedná se o webovou interaktivní plochu, kterou používají datoví vědci a datoví inženýři k psaní kódu, který využívá bohaté vizualizace a text Markdownu. Datoví inženýři zapisuje kód pro příjem dat, přípravu dat a transformaci dat. Datoví vědci také používají poznámkové bloky k vytváření řešení strojového učení, včetně vytváření experimentů a modelů, sledování modelů a nasazení.

S poznámkovým blokem Fabric můžete:

  • Začněte s nulovým úsilím o nastavení.
  • Snadné zkoumání a zpracování dat pomocí intuitivního prostředí s nízkým kódem
  • Udržujte data zabezpečená pomocí integrovaných podnikových funkcí zabezpečení.
  • Analýza dat v nezpracovaných formátech (CSV, txt, JSON atd.), zpracovaných formátech souborů (parquet, Delta Lake atd.) s využitím výkonných funkcí Sparku
  • Buďte produktivní díky vylepšeným možnostem vytváření a integrované vizualizaci dat.

Tento článek popisuje, jak používat poznámkové bloky v prostředích datových věd a přípravy dat.

Kontext zabezpečení spuštěného poznámkového bloku

Spuštění poznámkového bloku je možné aktivovat třemi různými způsoby v prostředcích infrastruktury s plnou flexibilitou pro splnění různých scénářů:

  • Interaktivní spuštění: Uživatel ručně aktivuje provádění prostřednictvím různých položek uživatelského rozhraní nebo volání rozhraní REST API. Spuštění by se spustilo v kontextu zabezpečení aktuálního uživatele.
  • Aktivita kanálu Spustit jako: Spuštění se aktivuje z kanálu služby Fabric Data Factory. Podrobné kroky najdete v aktivitě poznámkového bloku. Spuštění by bylo spuštěno v kontextu zabezpečení vlastníka kanálu.
  • Plánovač: Spuštění se aktivuje z plánu plánovače. Spuštění by bylo spuštěno v kontextu zabezpečení uživatele, který nastavil nebo aktualizoval plán plánovače.

Flexibilita těchto možností spouštění s různým kontextem zabezpečení umožňuje splnit různé scénáře a požadavky, ale také vyžaduje, abyste při návrhu a vývoji poznámkového bloku věděli o kontextu zabezpečení, jinak může způsobit neočekávané chování a dokonce i některé problémy se zabezpečením.

Při prvním vytvoření poznámkového bloku se zobrazí zpráva s upozorněním, která vám připomene riziko spuštění kódu bez kontroly.

Snímek obrazovky s upozorněním na spuštění poznámkového bloku

Tady je několik osvědčených postupů, které vám pomůžou vyhnout se problémům se zabezpečením:

  • Než poznámkový blok spustíte ručně, otevřete nastavení poznámkového bloku a zkontrolujte část Podrobnosti na panelu Informace o aktualizaci úprav, ujistěte se, že jste v pořádku s nejnovější změnou.
  • Než přidáte aktivitu poznámkového bloku do kanálu, otevřete nastavení poznámkového bloku a zkontrolujte část Podrobnosti na panelu Informace o aktualizaci úprav, ujistěte se, že jste v pořádku s nejnovější změnou. Pokud si nejste jistí nejnovější změnou, lépe otevřete poznámkový blok a zkontrolujte změnu předtím, než ji přidáte do kanálu.
  • Než plán plánovače aktualizujete, otevřete nastavení poznámkového bloku a zkontrolujte část Podrobnosti na panelu Informace o aktualizaci úprav, ujistěte se, že jste v pořádku s nejnovější změnou. Pokud si nejste jistí nejnovější změnou, před aktualizací plánu plánovače si ji můžete prohlédnout a zkontrolovat poznámkový blok.
  • Rozdělte pracovní prostor do jiné fáze (vývoj, testování, prod) a kontrolujte přístup různých fází, abyste se vyhnuli problému se zabezpečením. Přidejte pouze uživatele, kterému důvěřujete, do fáze prod.

Vytváření poznámkových bloků

Můžete buď vytvořit nový poznámkový blok, nebo importovat existující poznámkový blok.

Vytvoření nového poznámkového bloku

Stejně jako u jiných standardních procesů vytváření položek Fabric můžete snadno vytvořit nový poznámkový blok z domovské stránky Fabric Datoví technici, možnosti Nový pracovní prostor nebo Vytvořit centrum.

Import existujících poznámkových bloků

Z Datoví technici nebo domovské stránky Datová Věda můžete importovat jeden nebo více existujících poznámkových bloků z místního počítače do pracovního prostoru Prostředků infrastruktury. Poznámkové bloky Prostředků infrastruktury rozpoznávají standardní soubory Jupyter Notebook .ipynb a zdrojové soubory, jako jsou .py, .scala a .sql, a odpovídajícím způsobem vytvářejí nové položky poznámkového bloku.

Snímek obrazovky znázorňující, kde najít možnosti poznámkového bloku v nabídce Nový

Export poznámkového bloku

Poznámkový blok můžete exportovat do jiných standardních formátů. Poznámkový blok Synapse je možné exportovat do:

  • Standardní soubor poznámkového bloku (.ipynb), který se používá pro poznámkové bloky Jupyter.
  • Soubor HTML (.html), který lze otevřít přímo v prohlížeči.
  • Soubor Pythonu (.py).
  • Soubor Latex (.tex).

Snímek obrazovky znázorňující, kam se má poznámkový blok exportovat

Uložení poznámkového bloku

V prostředcích infrastruktury se poznámkový blok automaticky uloží po otevření a úpravě. Nemusíte se starat o ztrátu změn kódu. Pomocí příkazu Uložit kopii můžete také naklonovat jinou kopii v aktuálním pracovním prostoru nebo do jiného pracovního prostoru.

Snímek obrazovky znázorňující, kam uložit kopii

Pokud chcete poznámkový blok uložit ručně, můžete přepnout na možnost Ruční uložení, abyste měli místní větev položky poznámkového bloku, a pak změny uložte pomocí kláves Uložit nebo CTRL+s .

Snímek obrazovky znázorňující, kam přepnout ruční ukládání

Můžete také přepnout do režimu ručního ukládání výběrem možnosti Upravit ->Uložit ->Ruční. Pokud chcete zapnout místní větev poznámkového bloku a pak ho uložit ručně, vyberte Uložit nebo použijte klávesovou zkratku Ctrl+s .

Připojení lakehouse a poznámkových bloků

Poznámkové bloky prostředků infrastruktury teď podporují úzké interakce s jezery; nový nebo existující jezero můžete snadno přidat z Průzkumníka Lakehouse.

V Průzkumníku Lakehouse můžete přejít na jiné jezero a nastavit ho jako výchozí připnutím. Výchozí nastavení se pak připojí k pracovnímu adresáři modulu runtime a můžete číst nebo zapisovat do výchozího jezera pomocí místní cesty.

Snímek obrazovky znázorňující, kde připnout výchozí jezero

Poznámka:

Po připnutí nového jezera nebo přejmenování výchozího jezera musíte relaci restartovat.

Přidání nebo odebrání jezerahouse

Výběrem ikony X vedle názvu objektu lakehouse ho odeberete z karty poznámkového bloku, ale položka lakehouse stále v pracovním prostoru existuje.

Pokud chcete do poznámkového bloku přidat další objekty lakehouse, vyberte Přidat jezero , a to buď přidáním existujícího objektu, nebo vytvořením nového jezera.

Prozkoumání souboru lakehouse

Podsložka a soubory v části Tabulky a soubory v zobrazení Jezero se zobrazují v oblasti obsahu mezi seznamem lakehouse a obsahem poznámkového bloku. Výběrem různých složek v části Tabulky a Soubory aktualizujte oblast obsahu.

Operace se složkami a soubory

Pokud vyberete soubor (.csv, .parquet, .txt, .jpg, .png atd.) kliknutím pravým tlačítkem myši, můžete k načtení dat použít rozhraní API Spark nebo Pandas. Nová buňka kódu se vygeneruje a vloží pod buňku fokusu.

Cestu můžete snadno zkopírovat v jiném formátu než ve vybraném souboru nebo složce a použít odpovídající cestu v kódu.

Snímek obrazovky s místní nabídkou souborů v jezeře

Prostředky poznámkového bloku

Průzkumník prostředků poznámkového bloku poskytuje systém souborů podobný systému Unix, který vám pomůže spravovat složky a soubory. Nabízí zapisovatelný prostor systému souborů, ve kterém můžete ukládat malé soubory, jako jsou moduly kódu, sémantické modely a obrázky. K nim můžete snadno přistupovat pomocí kódu v poznámkovém bloku, jako kdybyste pracovali s místním systémem souborů.

Animovaný obrázek GIF s prostředky poznámkového bloku

Tato integrovaná složka je systémově předdefinovaná složka pro každou instanci poznámkového bloku. Uchovává až 500 MB úložiště, aby se ukládaly závislosti aktuálního poznámkového bloku. Toto jsou klíčové funkce prostředků poznámkového bloku:

  • Můžete použít běžné operace, jako je vytvoření, odstranění, nahrávání, stahování, přetažení, přejmenování, duplikování a vyhledávání v uživatelském rozhraní.
  • K rychlému zkoumání můžete použít relativní cesty builtin/YourData.txt . Tato mssparkutils.nbResPath metoda vám pomůže vytvořit úplnou cestu.
  • Ověřená data můžete snadno přesunout do jezera prostřednictvím možnosti Zapisovat do jezera . Prostředky infrastruktury vklyly bohaté fragmenty kódu pro běžné typy souborů, které vám pomůžou rychle začít.
  • Tyto prostředky jsou také k dispozici pro použití v případě spuštění referenčního poznámkového bloku prostřednictvím mssparkutils.notebook.run().

Poznámka:

  • Prostředky infrastruktury v současné době podporují nahrávání určitých typů souborů prostřednictvím uživatelského rozhraní, včetně souborů .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg a .xlsx. Do integrované složky můžete zapisovat pomocí typů souborů, které nejsou v seznamu prostřednictvím kódu, ale poznámkové bloky Fabric nepodporují generování fragmentů kódu u nepodporovaných typů souborů.
  • Každá velikost souboru musí být menší než 50 MB a integrovaná složka umožňuje celkem až 100 instancí souborů a složek.
  • Při použití mssparkutils.notebook.run()použijte mssparkutils.nbResPath příkaz pro přístup k cílovému prostředku poznámkového bloku. Relativní cesta "builtin/" vždy bude odkazovat na integrovanou složku kořenového poznámkového bloku.

Spolupráce v poznámkovém bloku

Poznámkový blok Fabric je položka pro spolupráci, která podporuje více uživatelů, kteří upravují stejný poznámkový blok.

Když otevřete poznámkový blok, ve výchozím nastavení přejdete do režimu spoluvytváření a každá úprava poznámkového bloku se automaticky uloží. Pokud vaši kolegové otevřou stejný poznámkový blok najednou, uvidíte jejich profil, spustit výstup, ukazatel kurzoru, indikátor výběru a upravit trasování. Pomocí funkcí pro spolupráci můžete snadno provádět párové programování, vzdálené ladění a scénáře doučování.

Snímek obrazovky zobrazující buňku kódu s úpravou jiného uživatele

Sdílení poznámkového bloku

Sdílení poznámkového bloku je pohodlný způsob, jak spolupracovat s členy týmu. Autorizované role pracovního prostoru můžou ve výchozím nastavení zobrazovat nebo upravovat nebo spouštět poznámkové bloky. Poznámkový blok můžete sdílet se zadanými oprávněními udělenými.

  1. Na panelu nástrojů poznámkového bloku vyberte Sdílet .

    Snímek obrazovky znázorňující, kde vybrat Sdílet

  2. Vyberte odpovídající kategorii lidí, kteří můžou tento poznámkový blok zobrazit. Pro příjemce můžete zvolit oprávnění Sdílet, Upravit nebo Spustit .

    Snímek obrazovky znázorňující, kde vybrat oprávnění

  3. Po výběru možnosti Použít můžete poznámkový blok poslat přímo nebo zkopírovat odkaz ostatním. Příjemci pak můžou poznámkový blok otevřít s odpovídajícím zobrazením uděleným úrovní oprávnění.

    Snímek obrazovky znázorňující, kde vytvořit a odeslat odkaz

  4. Pokud chcete oprávnění poznámkového bloku dál spravovat, vyberte Seznam>položek pracovního prostoru Další možnosti a pak vyberte Spravovat oprávnění. Na této obrazovce můžete aktualizovat stávající přístup a oprávnění k poznámkovému bloku.

    Snímek obrazovky znázorňující, kde spravovat oprávnění v pracovním prostoru

Okomentování buňky kódu

Komentování je další užitečnou funkcí pro scénáře spolupráce. Prostředky infrastruktury v současné době podporují přidávání komentářů na úrovni buněk.

  1. Výběrem tlačítka Komentáře na panelu nástrojů poznámkového bloku nebo indikátorem komentáře buňky otevřete podokno Komentáře.

    Snímek obrazovky znázorňující, kde vybrat komentář

  2. Vyberte kód v buňce kódu, v podokně Komentáře vyberte Nový, přidejte komentáře a pak vyberte Publikovat komentář, který chcete uložit.

    Snímek obrazovky znázorňující, kde vybrat Nový

  3. Pokud je potřebujete, vyhledejte možnosti Upravit komentář, Vyřešit vlákno a Odstranit vlákno výběrem možnosti Další vedle komentáře.

Označování ostatních v komentáři

Označení odkazuje na zmínku a upozorňování uživatele ve vlákně komentáře, což efektivně vylepšuje spolupráci na konkrétních specifikách.

  1. Vyberte část kódu v buňce a nové vlákno komentáře.

  2. Zadejte uživatelské jméno a zvolte správné jméno v seznamu návrhů, pokud chcete někoho zmínit pro diskuzi o určité části.

  3. Sdílejte přehledy a publikujte je.

  4. Aktivuje se e-mailové oznámení a uživatel klikne na odkaz Otevřít komentáře a rychle tuto buňku vyhledá.

  5. Kromě toho povolte a nakonfigurujte oprávnění pro uživatele při označování uživatele, který nemá přístup, a ujistěte se, že jsou vaše prostředky kódu dobře spravované.

Animovaný obrázek GIF označování ostatních v komentáři

Poznámka:

U položky komentáře už označený uživatel neobdrží e-mailové oznámení, pokud komentář aktualizujete do jedné hodiny. Ale pošle e-mailové oznámení novému označenému uživateli.

Přepnutí režimu poznámkového bloku

Poznámkové bloky prostředků infrastruktury podporují dva režimy, mezi kterými můžete snadno přepínat: režim úprav a režim zobrazení .

Snímek obrazovky znázorňující, kde se přepínají režimy

  • Režim úprav: Buňky můžete upravovat a spouštět a spolupracovat s ostatními v poznámkovém bloku.
  • Režim zobrazení: Obsah buňky, výstup a komentáře poznámkového bloku můžete jenom zobrazit. Všechny operace, které v poznámkovém bloku provádějí změny, jsou zakázané.