Samouczek dla języka Python: przewidywanie opłat za taksówkę w Nowym Jorku przy użyciu klasyfikacji binarnej

Dotyczy: SQL Server 2017 (14.x) i nowsze wersje usługi Azure SQL Managed Instance

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services lub klastrami danych big data.

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services.

W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami Machine Learning Services w usłudze Azure SQL Managed Instance.

Utworzysz i wdrożysz oparte na języku Python rozwiązanie do uczenia maszynowego przy użyciu przykładowej bazy danych w programie SQL Server. Użyjesz języka T-SQL, Visual Studio Code lub narzędzia SQL Server Management Studio oraz wystąpienia bazy danych z obsługą uczenia maszynowego z wykorzystaniem SQL i wsparciem dla języka Python.

W tej serii samouczków przedstawiono funkcje języka Python używane w przepływie pracy modelowania danych. Części obejmują eksplorację danych, kompilowanie i trenowanie binarnego modelu klasyfikacji oraz wdrażanie modelu. Użyjesz przykładowych danych z Nowojorskiej Komisji ds. Taksówek i Limuzyn. Model, który utworzysz, przewiduje, czy podróż może spowodować napiwek na podstawie godziny dnia, odległości podróży i lokalizacji odbioru.

W pierwszej części tej serii zainstalujesz wymagania wstępne i przywrócisz przykładową bazę danych. W dwóch i trzech częściach utworzysz kilka skryptów języka Python, aby przygotować dane i wytrenować model uczenia maszynowego. Następnie w części czterech i pięciu uruchomisz te skrypty języka Python w bazie danych przy użyciu procedur składowanych języka T-SQL.

W tym artykule dowiesz się:

Instalowanie wymagań wstępnych
Przywracanie przykładowej bazy danych

W drugiej części zapoznasz się z przykładowymi danymi i wygenerujesz niektóre wykresy.

W trzeciej części dowiesz się, jak tworzyć funkcje na podstawie danych pierwotnych przy użyciu funkcji Transact-SQL. Następnie wywołasz tę funkcję z procedury składowanej, aby utworzyć tabelę zawierającą wartości funkcji.

W czwartej części załadujesz moduły i wywołasz niezbędne funkcje, aby utworzyć i wytrenować model przy użyciu procedury składowanej programu SQL Server.

W części piątej dowiesz się, jak operacjonalizować modele, które zostały wytrenowane i zapisane w części czwartej.

Uwaga / Notatka

Ten samouczek jest dostępny zarówno w języku R, jak i Python. Aby zapoznać się z wersją języka R, zobacz R tutorial: Predict NYC taxi fares with binary classification (Samouczek języka R: przewidywanie taryf taksówek w Nowym Jorku przy użyciu klasyfikacji binarnej).

Wymagania wstępne

Instalowanie usług SQL Server Machine Learning Services przy użyciu języka Python

Wszystkie zadania można wykonywać przy użyciu Transact-SQL procedur składowanych w programie Visual Studio Code lub Management Studio.

W tej serii samouczków założono, że posiadasz znajomość podstawowych operacji na bazach danych, takich jak tworzenie baz danych i tabel, importowanie danych i pisanie zapytań SQL. Nie zakłada się, że znasz język Python i podano cały kod w języku Python.

Tło dla programistów SQL

Proces tworzenia rozwiązania uczenia maszynowego jest złożony, który może obejmować wiele narzędzi oraz koordynację ekspertów w różnych fazach:

uzyskiwanie i czyszczenie danych
eksplorowanie danych i tworzenie funkcji przydatnych do modelowania
trenowanie i dostrajanie modelu
wdrażanie w środowisku produkcyjnym

Programowanie i testowanie rzeczywistego kodu najlepiej wykonać przy użyciu dedykowanego środowiska programistycznego. Jednak po pełnym przetestowaniu skryptu można go łatwo wdrożyć w programie SQL Server przy użyciu Transact-SQL procedur składowanych w znanym środowisku programu Visual Studio Code lub Management Studio. Zawijanie kodu zewnętrznego w procedurach składowanych jest podstawowym mechanizmem operacjonalizacji kodu w programie SQL Server.

Po zapisaniu modelu w bazie danych można wywołać model przewidywania z Transact-SQL przy użyciu procedur składowanych.

Niezależnie od tego, czy jesteś programistą SQL, który dopiero zaczyna przygodę z językiem Python, czy programistą Python, który jest nowy w SQL, w pięciu częściach serii samouczków przedstawiono typowy przepływ pracy do przeprowadzania analizy w bazie danych przy użyciu języka Python i SQL Server.

Dalsze kroki

W tym artykule dowiesz się:

Zainstalowane wymagania wstępne
Przywrócono przykładową bazę danych

Samouczek w języku Python: eksplorowanie i wizualizowanie danych

Opinia

Czy ta strona była pomocna?

Last updated on 2026-02-18