Cvičení – vytvoření poznámkového bloku Azure a import dat

Dokončeno

Prvním krokem je vytvoření poznámkového bloku Azure. Poznámkové bloky Azure jsou obsažené v projektech, jejichž primárním účelem je seskupovat související poznámkové bloky. V této lekci vytvoříte nový projekt a v něm pak vytvoříte poznámkový blok.

  1. V prohlížeči přejděte na https://notebooks.azure.com.

  2. Přihlaste se pomocí svého účtu Microsoft.

  3. V nabídce nahoře na stránce klikněte na My Projects (Moje projekty).

  4. Nahoře na stránce My Projects klikněte na tlačítko + New Project (+ Nový projekt).

  5. Vytvořte nový projekt s názvem Poznámkové bloky ML nebo podobným názvem. Pokud chcete, můžete zrušit zaškrtnutí políčka Public (Veřejný), ale když projekt nastavíte jako veřejný, bude možné obsažené poznámkové bloky sdílet s ostatními uživateli prostřednictvím odkazů, sociálních médií nebo e-mailu. Pokud si nejste jistí, kterou možnost zvolit, můžete projekt na veřejný nebo soukromý snadno změnit později.

    Creating a project.

    Vytvoření projektu

  6. Klikněte na + New (+ Nový), v nabídce vyberte Notebook (Poznámkový blok) a přidejte poznámkový blok do projektu.

    Adding a notebook to the project.

    Přidání poznámkového bloku do projektu

  7. Pojmenujte poznámkový blok například jako Včasné přílety.ipynb a jako jazyk vyberte Python 3.6. Vytvoří se tak poznámkový blok s jádrem Python 3.6 pro spouštění kódu Pythonu. Jednou z předností poznámkových bloků Azure je, že volbou různých jader můžete použít různé jazyky.

    Creating a notebook.

    Vytvoření poznámkového bloku

    Pokud vás zajímá, přípona názvu souboru .ipynb znamená "IPython notebook". Poznámkové bloky Jupyter byly původně označovány jako poznámkové bloky IPython (Interactive Python) a podporovaly pouze Python jako programovací jazyk. Název Jupyter je kombinací slov Julia, Python a R – základních programovacích jazyků, které Jupyter podporuje.

  8. Kliknutím na poznámkový blok ho otevřete pro úpravy.

    Opening the notebook.

    Otevření poznámkového bloku

Při práci s Azure Notebooks můžete vytvářet další projekty a poznámkové bloky. Poznámkové bloky můžete vytvářet úplně od začátku, nebo můžete nahrát existující poznámkové bloky.

Poznámkové bloky Jupyter jsou vysoce interaktivní. Mohou obsahovat spustitelný kód, a proto poskytují perfektní platformu pro práci s daty a vytváření prediktivních modelů na jejich základě.

  1. Do první buňky v poznámkovém bloku zadejte následující příkaz:

    !curl https://topcs.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Tip

    curl je příkaz Bash. Příkazy Bash můžete v poznámkových blocích Jupyter provést tak, že k nim jako předponu přidáte vykřičník. Tímto příkazem stáhnete soubor CSV ze služby Azure Blob Storage a uložíte ho pod názvem flightdata.csv.

  2. Kliknutím na tlačítko Run (Spustit) spustíte příkaz curl.

    Importing a dataset.

    Import datové sady

  3. Do druhé buňky v poznámkovém bloku zadejte následující kód Pythonu, aby se načetl soubor flightdata.csv, vytvořil se z něj datový rámec Pandas a zobrazilo se prvních pět řádků.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Spusťte kód kliknutím na tlačítko Run. Zkontrolujte, že jste získali výstup podobný tomu na obrázku níže.

    Loading the dataset.

    Načtení datové sady

    Datový rámec, který jste vytvořili, obsahuje informace o včasných příletech u významné americké letecké společnosti. Má více než 11 000 řádků a 26 sloupců. (Výstup říká "5 řádků", protože hlavní funkce datového rámce vrátí pouze prvních pět řádků.) Každý řádek představuje jeden let a obsahuje informace, jako je původ, cíl, naplánovaný čas odletu a informace o tom, jestli let přistál včas nebo pozdě. Později v tomto modulu se na data podíváme podrobněji.

  5. K uložení poznámkového bloku použijte příkaz File ->Save a Checkpoint.

Pomocí vodorovného posuvníku se můžete posouvat doleva a doprava a zobrazit si tak všechny sloupce v datové sadě. Kolik sloupců datová sada obsahuje? Dokážete z názvů sloupců odhadnout, co který sloupec představuje?