Упражнение. Создание записной книжки Azure и импорт данных

Завершено

Для начала нужно создать записную книжку Azure. Записные книжки Azure содержатся в проектах, предназначенных, в первую очередь, для группирования связанных записных книжек. В этом модуле вы создадите новый проект, а внутри него — записную книжку.

  1. В браузере перейдите по адресу https://notebooks.azure.com

  2. Войдите с помощью учетной записи Майкрософт.

  3. Щелкните "Мои проекты " в меню в верхней части страницы.

  4. Нажмите кнопку +Создать проект в верхней части страницы "Мои проекты".

  5. Создайте новый проект и назовите его "Записные книжки для ML" или что-нибудь в этом духе. Можете снять флажок в поле "Общедоступный", если хотите, но если проект будет общедоступным, вы сможете делиться записными книжками с другими через ссылки, в социальных сетях или по электронной почте. Если вы не знаете, что выбрать, проект можно сделать общедоступным или закрытым позже.

    Создание проекта.

    Создание проекта

  6. Нажмите кнопку +Создать и выберите "Записная книжка " в меню, чтобы добавить записную книжку в проект.

    Добавление записной книжки в проект.

    Добавление записной книжки в проект

  7. Присвойте ноутбуку имя, например "Вовремя прибывающие рейсы.ipynb", и выберите Python 3.6 в качестве языка. Вы создадите записную книжку с ядром Python 3.6 для выполнения кода Python. Одним из преимуществ записных книжек Azure является возможность использовать различные языки, выбирая разные ядра.

    Создание записной книжки.

    Создание записной книжки

    Если вам интересно, расширение имени файла .ipynb означает "Записная книжка IPython". Записные книжки Jupyter изначально известны как записные книжки IPython (Интерактивный Python), и они поддерживают только Python в качестве языка программирования. Название Jupyter образовано от слов Julia, Python и R — основных поддерживаемых языков программирования в Jupyter.

  8. Щелкните записную книжку, чтобы открыть ее для редактирования.

    Открытие записной книжки.

    Открытие записной книжки

При работе с записными книжками Azure можно создавать дополнительные проекты и записные книжки. Записные книжки можно создать с нуля или загрузить существующие.

Записные книжки Jupyter очень интерактивны, и так как они могут содержать исполняемый код, это идеальная платформа для обработки данных и построения моделей прогнозирования на их основе.

  1. В первой ячейке записной книжки введите следующую команду:

    !curl https://topics.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Совет

    curl — это команда Bash. В записной книжке Jupyter можно выполнять команды Bash, ставя перед ними восклицательный знак. Эта команда загружает CSV-файл из хранилища BLOB-объектов Azure и сохраняет его с помощью имени flightdata.csv.

  2. Нажмите кнопку "Выполнить ", чтобы выполнить curl команду.

    Импорт набора данных.

    Импорт набора данных

  3. Во второй ячейке записной книжки введите следующий код Python, чтобы загрузить flightdata.csv, создать кадр данных Pandas из него и отобразить первые пять строк.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Нажмите кнопку "Выполнить ", чтобы выполнить код. Убедитесь, что выходные данные похожи на следующие.

    Загрузка набора данных.

    Загрузка набора данных

    Созданный DataFrame содержит сведения о прибытии по расписанию для крупной авиакомпании США. В нем более 11 000 строк и 26 столбцов. (Выходные данные говорят "5 строк", так как головная функция Кадра данных возвращает только первые пять строк.) Каждая строка представляет один рейс и содержит такие сведения, как источник, место назначения, время запланированного вылета и время прибытия рейса во время или поздно. Мы рассмотрим данные подробнее чуть позже в этом модуле.

  5. Чтобы сохранить записную книжку, используйте команду "Файл ->Сохранить и контрольную точку ".

Просмотрите все столбцы в наборе данных, используя полосу горизонтальной прокрутки для прокрутки влево и вправо. Сколько столбцов содержит набор данных? Вы уже догадались, какие данные содержит каждый столбец, по его имени?