Udostępnij za pomocą


Samouczek dla języka Python: przewidywanie opłat za taksówkę w Nowym Jorku przy użyciu klasyfikacji binarnej

Dotyczy: SQL Server 2017 (14.x) i nowsze wersje usługi Azure SQL Managed Instance

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services lub klastrami danych big data.

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services.

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami Machine Learning Services w usłudze Azure SQL Managed Instance.

Utworzysz i wdrożysz oparte na języku Python rozwiązanie do uczenia maszynowego przy użyciu przykładowej bazy danych w programie SQL Server. Użyjesz języka T-SQL, Azure Data Studio lub SQL Server Management Studio oraz wystąpienia bazy danych z obsługą uczenia maszynowego SQL i języka Python.

W tej serii samouczków przedstawiono funkcje języka Python używane w przepływie pracy modelowania danych. Części obejmują eksplorację danych, kompilowanie i trenowanie binarnego modelu klasyfikacji oraz wdrażanie modelu. Użyjesz przykładowych danych z Nowojorskiej Komisji ds. Taksówek i Limuzyn. Model, który utworzysz, przewiduje, czy podróż może spowodować napiwek na podstawie godziny dnia, odległości podróży i lokalizacji odbioru.

W pierwszej części tej serii zainstalujesz wymagania wstępne i przywrócisz przykładową bazę danych. W dwóch i trzech częściach utworzysz kilka skryptów języka Python, aby przygotować dane i wytrenować model uczenia maszynowego. Następnie w części czterech i pięciu uruchomisz te skrypty języka Python w bazie danych przy użyciu procedur składowanych języka T-SQL.

W tym artykule dowiesz się:

  • Instalowanie wymagań wstępnych
  • Przywracanie przykładowej bazy danych

W drugiej części zapoznasz się z przykładowymi danymi i wygenerujesz niektóre wykresy.

W trzeciej części dowiesz się, jak tworzyć funkcje na podstawie danych pierwotnych przy użyciu funkcji Transact-SQL. Następnie wywołasz tę funkcję z procedury składowanej, aby utworzyć tabelę zawierającą wartości funkcji.

W czwartej części załadujesz moduły i wywołasz niezbędne funkcje, aby utworzyć i wytrenować model przy użyciu procedury składowanej programu SQL Server.

W części piątej dowiesz się, jak operacjonalizować modele, które zostały wytrenowane i zapisane w części czwartej.

Wymagania wstępne

Wszystkie zadania można wykonywać przy użyciu Transact-SQL procedur składowanych w narzędziu Azure Data Studio lub Management Studio.

W tej serii samouczków założono, że posiadasz znajomość podstawowych operacji na bazach danych, takich jak tworzenie baz danych i tabel, importowanie danych i pisanie zapytań SQL. Nie zakłada się, że znasz język Python i podano cały kod w języku Python.

Tło dla programistów SQL

Proces tworzenia rozwiązania uczenia maszynowego jest złożony, który może obejmować wiele narzędzi oraz koordynację ekspertów w różnych fazach:

  • uzyskiwanie i czyszczenie danych
  • eksplorowanie danych i tworzenie funkcji przydatnych do modelowania
  • trenowanie i dostrajanie modelu
  • wdrażanie w środowisku produkcyjnym

Programowanie i testowanie rzeczywistego kodu najlepiej wykonać przy użyciu dedykowanego środowiska programistycznego. Jednak po pełnym przetestowaniu skryptu można go łatwo wdrożyć w programie SQL Server przy użyciu Transact-SQL procedur składowanych w znanym środowisku programu Azure Data Studio lub Management Studio. Zawijanie kodu zewnętrznego w procedurach składowanych jest podstawowym mechanizmem operacjonalizacji kodu w programie SQL Server.

Po zapisaniu modelu w bazie danych można wywołać model przewidywania z Transact-SQL przy użyciu procedur składowanych.

Niezależnie od tego, czy jesteś programistą SQL, który dopiero zaczyna przygodę z językiem Python, czy programistą Python, który jest nowy w SQL, w pięciu częściach serii samouczków przedstawiono typowy przepływ pracy do przeprowadzania analizy w bazie danych przy użyciu języka Python i SQL Server.

Dalsze kroki

W tym artykule dowiesz się:

  • Zainstalowane wymagania wstępne
  • Przywrócono przykładową bazę danych