Руководство. Импорт записных книжек Jupyter из GitHub в Azure Cosmos DB для NoSQL (предварительная версия)
ОБЛАСТЬ ПРИМЕНЕНИЯ: NoSQL
Предупреждение
Функция Jupyter Notebook в Azure Cosmos DB будет прекращена 30 марта 2024 г.; Вы не сможете использовать встроенные записные книжки Jupyter из учетной записи Azure Cosmos DB. Мы рекомендуем использовать поддержку Visual Studio Code для записных книжек Jupyter или предпочитаемого клиента записных книжек.
В этом руководстве описывается, как импортировать записные книжки Jupyter из репозитория GitHub и запустить их в учетной записи Azure Cosmos DB для NoSQL. После импорта записных книжек можно запустить, изменить их и сохранить изменения в том же репозитории GitHub.
Необходимые компоненты
- Существующая учетная запись Azure Cosmos DB для NoSQL.
- Если у вас есть подписка Azure, создайте новую учетную запись.
- Нет подписки Azure? Вы можете попробовать Azure Cosmos DB бесплатно без кредитных карта.
Создание копии репозитория GitHub
Перейдите к репозиторию шаблонов шаблонов azure-samples/cosmos-db-nosql-notebooks .
Создайте копию репозитория шаблонов в собственной учетной записи или организации GitHub.
Извлечение записных книжек из GitHub
Вместо создания записных книжек при каждом запуске рабочей области можно импортировать существующие записные книжки из GitHub. В этом разделе описано, как подключиться к существующему репозиторию GitHub с примерами записных книжек.
Перейдите к учетной записи Azure Cosmos DB и откройте Обозреватель данных.
Выберите Подключение в GitHub.
В диалоговом окне Подключение в GitHub выберите вариант доступа, соответствующий репозиторию GitHub, а затем выберите "Авторизовать доступ".
Завершите рабочий процесс авторизации GitHub сторонних производителей, предоставляющий доступ к организации, необходимой для доступа к репозиторию GitHub. Дополнительные сведения см. в разделе "Авторизация приложений GitHub".
В диалоговом окне "Управление параметрами GitHub" выберите созданный ранее репозиторий GitHub.
Вернитесь в Обозреватель данных, найдите новое дерево узлов для закрепленный репозиторий и откройте файл site-metrics-python.ipynb.
В редакторе записной книжки найдите следующую ячейку.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
В настоящее время ячейка выводит количество уникальных элементов. Замените окончательную строку ячейки новой строкой, чтобы вывести количество уникальных действий в наборе данных.
df_cosmos.groupby("Action").size()
Запустите все ячейки последовательно, чтобы увидеть новый набор данных. Новый набор данных должен содержать только три потенциальных значения для столбца Action . При необходимости можно выбрать визуализацию данных для результатов.
Отправка изменений записной книжки на GitHub
Совет
В настоящее время временные рабочие области будут удалены из-за простоя в течение 20 минут. Максимальное время использования в день составляет 60 минут. Эти ограничения могут быть изменены в будущем.
Чтобы сохранить работу безвозвратно, сохраните записные книжки обратно в репозиторий GitHub. В этом разделе вы сохраните изменения из временной рабочей области на GitHub в качестве новой фиксации.
Нажмите кнопку "Сохранить ", чтобы создать фиксацию для изменения в записной книжке.
В диалоговом окне "Сохранить" добавьте описательное сообщение фиксации.
Перейдите к репозиторию GitHub, созданному с помощью браузера. Новая фиксация теперь должна отображаться в веб-репозитории.