Руководство. Импорт записных книжек Jupyter из GitHub в Azure Cosmos DB для NoSQL (предварительная версия)

ОБЛАСТЬ ПРИМЕНЕНИЯ: NoSQL

Предупреждение

Функция Jupyter Notebook в Azure Cosmos DB будет прекращена 30 марта 2024 г.; Вы не сможете использовать встроенные записные книжки Jupyter из учетной записи Azure Cosmos DB. Мы рекомендуем использовать поддержку Visual Studio Code для записных книжек Jupyter или предпочитаемого клиента записных книжек.

В этом руководстве описывается, как импортировать записные книжки Jupyter из репозитория GitHub и запустить их в учетной записи Azure Cosmos DB для NoSQL. После импорта записных книжек можно запустить, изменить их и сохранить изменения в том же репозитории GitHub.

Необходимые компоненты

Создание копии репозитория GitHub

  1. Перейдите к репозиторию шаблонов шаблонов azure-samples/cosmos-db-nosql-notebooks .

  2. Создайте копию репозитория шаблонов в собственной учетной записи или организации GitHub.

Извлечение записных книжек из GitHub

Вместо создания записных книжек при каждом запуске рабочей области можно импортировать существующие записные книжки из GitHub. В этом разделе описано, как подключиться к существующему репозиторию GitHub с примерами записных книжек.

  1. Перейдите к учетной записи Azure Cosmos DB и откройте Обозреватель данных.

  2. Выберите Подключение в GitHub.

    Screenshot of the Data Explorer with the 'Connect to GitHub' option highlighted.

  3. В диалоговом окне Подключение в GitHub выберите вариант доступа, соответствующий репозиторию GitHub, а затем выберите "Авторизовать доступ".

    Screenshot of the 'Connect to GitHub' dialog with options for various levels of access.

  4. Завершите рабочий процесс авторизации GitHub сторонних производителей, предоставляющий доступ к организации, необходимой для доступа к репозиторию GitHub. Дополнительные сведения см. в разделе "Авторизация приложений GitHub".

  5. В диалоговом окне "Управление параметрами GitHub" выберите созданный ранее репозиторий GitHub.

    Screenshot of the 'Manage GitHub settings' dialog with a list of unpinned and pinned repositories.

  6. Вернитесь в Обозреватель данных, найдите новое дерево узлов для закрепленный репозиторий и откройте файл site-metrics-python.ipynb.

    Screenshot of the pinned repositories in the Data Explorer.

  7. В редакторе записной книжки найдите следующую ячейку.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  8. В настоящее время ячейка выводит количество уникальных элементов. Замените окончательную строку ячейки новой строкой, чтобы вывести количество уникальных действий в наборе данных.

    df_cosmos.groupby("Action").size()
    
  9. Запустите все ячейки последовательно, чтобы увидеть новый набор данных. Новый набор данных должен содержать только три потенциальных значения для столбца Action . При необходимости можно выбрать визуализацию данных для результатов.

    Screenshot of the Pandas dataframe visualization for the data.

Отправка изменений записной книжки на GitHub

Совет

В настоящее время временные рабочие области будут удалены из-за простоя в течение 20 минут. Максимальное время использования в день составляет 60 минут. Эти ограничения могут быть изменены в будущем.

Чтобы сохранить работу безвозвратно, сохраните записные книжки обратно в репозиторий GitHub. В этом разделе вы сохраните изменения из временной рабочей области на GitHub в качестве новой фиксации.

  1. Нажмите кнопку "Сохранить ", чтобы создать фиксацию для изменения в записной книжке.

    Screenshot of the 'Save' option in the Data Explorer menu.

  2. В диалоговом окне "Сохранить" добавьте описательное сообщение фиксации.

    Screenshot of the 'Save' dialog with an example of a commit message.

  3. Перейдите к репозиторию GitHub, созданному с помощью браузера. Новая фиксация теперь должна отображаться в веб-репозитории.

    Screenshot of the updated notebook on the GitHub website.

Следующие шаги