Упражнение. Передача данных и создание точечной диаграммы

Завершено

Записные книжки Jupyter состоят из ячеек. Каждой ячейке назначается один из трех типов:

  • Markdown для ввода текста в формате markdown
  • Код для ввода кода, который выполняется в интерактивном режиме
  • Необработанный NBConvert для ввода данных во встроенном режиме

Код, введенный в ячейки кода, выполняется ядром, которое обеспечивает изолированную среду для выполнения записной книжки. Популярное ядро IPython поддерживает код, написанный на языке Python, но есть десятки других ядер с поддержкой других языков. Записные книжки Azure поддерживают Python, R и F# без дополнительной настройки. Они также поддерживают установку многих пакетов и библиотек, которые обычно используются в исследованиях.

Сейчас в редакторе записной книжки отображается пустая ячейка. В этом упражнении вы добавите содержимое к этой ячейке и другие ячейки для импорта пакетов Python, таких как NumPy, загрузите пару файлов с данными NASA по климату и создадите точечную диаграмму на основе этих данных.

  1. В первой ячейке задайте тип ячейки Markdown и введите в нее "Анализ изменений климата в записной книжке Azure":

    Defining a markdown cell.

    Определение ячейки Markdown

  2. Нажмите на панели инструментов кнопку +, чтобы добавить новую ячейку. Убедитесь, что тип ячейки Код, а затем введите следующий код Python в ячейку:

    import matplotlib.pyplot as plt
    import numpy as np
    from sklearn.linear_model import LinearRegression
    import seaborn as sns; sns.set()
    

    Adding a code cell.

    Добавление ячейки кода

  3. Теперь щелкните кнопку Запуск, чтобы запустить ячейку кода и импортировать пакеты, указанные в инструкциях import. Игнорируйте любые предупреждения, поскольку среда подготавливается в первый раз.

    Предупреждения можно удалить, выбрав ячейку кода и запустив ее еще раз.

    Running a code cell.

    Запуск ячейки кода

  4. Нажмите Файл в меню в верхней части страницы и выберите Отправить в раскрывающемся меню. Затем отправьте файлы 5-year-mean-1951-1980.csv и 5-year-mean-1882-2014.csv.

    Uploading data to the notebook.

    Передача данных в записную книжку

  5. Выберите /project в качестве папки назначения, чтобы файл не потерялся. Нажмите Начать отправку для передачи файлов, и ОК, когда передача завершится.

    Selecting destination folder for data.

    Выбор папки назначения для данных

  6. Поместите курсор в пустую ячейку внизу записной книжки. Введите "Импорт данных" как текст и измените тип ячейки на Markdown.

  7. Теперь добавьте ячейку для кода и вставьте следующий код.

    yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True)
    years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
    
  8. Нажмите кнопку Запуск, чтобы выполнить ячейку и использовать функцию NumPy loadtxt для загрузки отправленных данных. Данные находятся в памяти и могут использоваться приложением.

    Loading the data.

    Загрузка данных

  9. Поместите курсор в пустую ячейку внизу записной книжки. Измените тип ячейки на Markdown и введите "Создать точечную диаграмму" как текст.

  10. Добавьте ячейку кода и вставьте следующий код, который использует библиотеку Matplotlib, чтобы создать точечную диаграмму.

    plt.scatter(yearsBase, meanBase)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
  11. Нажмите Запуск, чтобы выполнить ячейку и создать точечную диаграмму.

    Scatter plot produced by Matplotlib.

    Точечная диаграмма, созданная Matplotlib

Загруженный вами набор данных использует средние значения за 30 лет между 1951 и 1980 годами для вычисления базовой температуры за этот период, а затем на основе средних температур за 5 лет рассчитывает разницу между средними значениями за 5 и за 30 лет для каждого года. Точечная диаграмма показывает различия годовой температуры.