Share via


Oktatóanyag: Jupyter-jegyzetfüzetek importálása a GitHubról az Azure Cosmos DB for NoSQL-be (előzetes verzió)

A KÖVETKEZŐRE VONATKOZIK: NoSQL

Figyelmeztetés:

Az Azure Cosmos DB Jupyter Notebooks szolgáltatása 2024. március 30-án megszűnik; az Azure Cosmos DB-fiókból nem használhat beépített Jupyter-jegyzetfüzeteket. Javasoljuk, hogy használja a Visual Studio Code támogatását a Jupyter-notebookokhoz vagy az előnyben részesített jegyzetfüzet-ügyfélhez.

Ez az oktatóanyag bemutatja, hogyan importálhat Jupyter-jegyzetfüzeteket egy GitHub-adattárból, és hogyan futtathatja őket egy Azure Cosmos DB for NoSQL-fiókban. A jegyzetfüzetek importálása után futtathatja, szerkesztheti és megőrizheti a módosításokat ugyanabba a GitHub-adattárba.

Előfeltételek

GitHub-adattár másolatának létrehozása

  1. Lépjen az azure-samples/cosmos-db-nosql-notebooks sablontárházhoz.

  2. Hozzon létre egy új másolatot a sablontárházról saját GitHub-fiókjában vagy szervezetében.

Jegyzetfüzetek lekérése a GitHubról

Ahelyett, hogy minden munkaterület indításakor új jegyzetfüzeteket hoz létre, importálhat meglévő jegyzetfüzeteket a GitHubról. Ebben a szakaszban egy meglévő GitHub-adattárhoz fog csatlakozni mintajegyzetfüzetekkel.

  1. Lépjen az Azure Cosmos DB-fiókjához, és nyissa meg az Adatkezelőt .

  2. Válassza Csatlakozás a GitHubra.

    Screenshot of the Data Explorer with the 'Connect to GitHub' option highlighted.

  3. A GitHub-Csatlakozás párbeszédpanelen válassza ki a GitHub-adattárnak megfelelő hozzáférési lehetőséget, majd válassza a Hozzáférés engedélyezése lehetőséget.

    Screenshot of the 'Connect to GitHub' dialog with options for various levels of access.

  4. Végezze el a GitHub harmadik féltől származó engedélyezési munkafolyamatát, amely hozzáférést biztosít a GitHub-adattár eléréséhez szükséges szervezet(ek)nek. További információ: A GitHub Apps engedélyezése.

  5. A GitHub beállításainak kezelése párbeszédpanelen válassza ki a korábban létrehozott GitHub-adattárat.

    Screenshot of the 'Manage GitHub settings' dialog with a list of unpinned and pinned repositories.

  6. Az Adatkezelőben keresse meg a rögzített adattár új csomópontfáját, és nyissa meg a website-metrics-python.ipynb fájlt.

    Screenshot of the pinned repositories in the Data Explorer.

  7. A jegyzetfüzet szerkesztőjében keresse meg a következő cellát.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  8. A cella jelenleg az egyedi elemek számát adja ki. Cserélje le a cella utolsó sorát egy új sorra az adathalmaz egyedi műveleteinek számának kimenetéhez.

    df_cosmos.groupby("Action").size()
    
  9. Futtassa az összes cellát egymás után az új adatkészlet megtekintéséhez. Az új adatkészletnek csak három lehetséges értéket kell tartalmaznia a Művelet oszlophoz. Igény szerint adatvizualizációt is választhat az eredményekhez.

    Screenshot of the Pandas dataframe visualization for the data.

Jegyzetfüzet-módosítások leküldése a GitHubra

Tipp.

Az ideiglenes munkaterületek jelenleg 20 percig üresjáratban maradnak. A napi maximális használati idő 60 perc. Ezek a korlátok a jövőben változhatnak.

A munka végleges mentéséhez mentse a jegyzetfüzeteket a GitHub-adattárba. Ebben a szakaszban a módosításokat az ideiglenes munkaterületről a GitHubra fogja őrizni új véglegesítésként.

  1. A Mentés gombra kattintva véglegesítést hozhat létre a jegyzetfüzet módosításához.

    Screenshot of the 'Save' option in the Data Explorer menu.

  2. A Mentés párbeszédpanelen adjon hozzá egy leíró véglegesítési üzenetet.

    Screenshot of the 'Save' dialog with an example of a commit message.

  3. Nyissa meg a böngészővel létrehozott GitHub-adattárat. Az új véglegesítésnek most már láthatónak kell lennie az online adattárban.

    Screenshot of the updated notebook on the GitHub website.

Következő lépések