Ćwiczenie — przekazywanie danych i tworzenie wykresu punktowego
Notesy Jupyter składają się z komórek. Każda komórka jest przypisana do jednego z trzech typów:
- Markdown do wprowadzania tekstu w formacie Markdown
- Kod do wprowadzania kodu, który jest uruchamiany interaktywnie
- Nieprzetworzone NBConvert do wprowadzania danych w tekście
Kod wprowadzony w komórkach kodu jest wykonywany przez jądro, które zapewnia izolowane środowisko do uruchomienia notatnika. Popularne jądro IPython obsługuje kod napisany w języku Python, ale dziesiątki innych jąder jest dostępnych obsługujących inne języki. Usługa Azure Notebooks ma wbudowaną obsługę języków Python, R oraz F#. Umożliwia również instalację wielu pakietów i bibliotek często używanych podczas badań.
W tej chwili w edytorze notesu wyświetlana jest pusta komórka. W tym ćwiczeniu dodasz zawartość do tej komórki i dodasz inne komórki, aby zaimportować pakiety języka Python, takie jak NumPy, załadować parę plików danych NASA zawierających dane klimatyczne i utworzyć wykres punktowy na podstawie danych.
W pierwszej komórce ustaw typ komórki na Markdown i wprowadź "Azure Notebook Climate Change Analysis" w komórce:
Definiowanie komórki markdown
Kliknij przycisk + na pasku narzędzi, aby dodać nową komórkę. Upewnij się, że typ komórki to Kod, a następnie wprowadź następujący kod w języku Python w komórce:
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
Dodawanie komórki kodu
Teraz kliknij przycisk Uruchom , aby uruchomić komórkę kodu i zaimportować pakiety określone w instrukcjach
import. Zignoruj wszelkie ostrzeżenia wyświetlane podczas przygotowywania środowiska po raz pierwszy.Możesz usunąć ostrzeżenia, wybierając komórkę „code” i uruchamiając ją ponownie.
Uruchamianie komórki kodu
Kliknij pozycję Plik w menu w górnej części strony, a następnie wybierz pozycję Przekaż z menu rozwijanego. Następnie przekaż pliki o nazwie 5-year-mean-1951-1980.csv i 5-year-mean-1882-2014.csv.
Przekazywanie danych do notesu
Wybierz /project jako folder docelowy , aby upewnić się, że pliki są utrwalane. Kliknij Rozpocznij przesyłanie, aby przesłać pliki, i OK po ich pomyślnym przesłaniu.
Wybieranie folderu docelowego dla danych
Umieść kursor w pustej komórce w dolnej części notesu. Wprowadź tekst "Importuj dane" i zmień typ komórki na Markdown.
Teraz dodaj komórkę Code i wklej następujący kod.
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)Kliknij przycisk Uruchom, aby uruchomić komórkę i użyć funkcji
loadtxtz biblioteki NumPy do załadowania danych, które przesłałeś. Dane znajdują się teraz w pamięci i mogą zostać użyte przez aplikację.
Ładowanie danych
Umieść kursor w pustej komórce w dolnej części notesu. Zmień typ komórki na Markdown i wprowadź tekst "Utwórz wykres punktowy".
Dodaj komórkę Code i wklej następujący kod, który używa biblioteki Matplotlib do utworzenia wykresu punktowego.
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()Kliknij Uruchom, aby uruchomić komórkę i utworzyć wykres rozrzutu.
Wykres punktowy generowany przez bibliotekę Matplotlib
Załadowany zestaw danych wykorzystuje średnią z 30 lat (od 1951 r. do 1980 r.), aby obliczyć temperaturę bazową dla tego okresu, a następnie na podstawie średnich temperatur z 5 lat oblicza różnicę pomiędzy średnią 5-letnią a 30-letnią dla każdego roku. Wykres punktowy przedstawia roczne różnice temperatur.