Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy: SQL Server 2017 (14.x) i nowsze wersje
usługi Azure SQL Managed Instance
W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services lub klastrami danych big data.
W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami SQL Server Machine Learning Services.
W tej pięcioczęściowej serii samouczków dla programistów SQL poznasz integrację języka Python z usługami Machine Learning Services w usłudze Azure SQL Managed Instance.
Utworzysz i wdrożysz oparte na języku Python rozwiązanie do uczenia maszynowego przy użyciu przykładowej bazy danych w programie SQL Server. Użyjesz języka T-SQL, Azure Data Studio lub SQL Server Management Studio oraz wystąpienia bazy danych z obsługą uczenia maszynowego SQL i języka Python.
W tej serii samouczków przedstawiono funkcje języka Python używane w przepływie pracy modelowania danych. Części obejmują eksplorację danych, kompilowanie i trenowanie binarnego modelu klasyfikacji oraz wdrażanie modelu. Użyjesz przykładowych danych z Nowojorskiej Komisji ds. Taksówek i Limuzyn. Model, który utworzysz, przewiduje, czy podróż może spowodować napiwek na podstawie godziny dnia, odległości podróży i lokalizacji odbioru.
W pierwszej części tej serii zainstalujesz wymagania wstępne i przywrócisz przykładową bazę danych. W dwóch i trzech częściach utworzysz kilka skryptów języka Python, aby przygotować dane i wytrenować model uczenia maszynowego. Następnie w części czterech i pięciu uruchomisz te skrypty języka Python w bazie danych przy użyciu procedur składowanych języka T-SQL.
W tym artykule dowiesz się:
- Instalowanie wymagań wstępnych
- Przywracanie przykładowej bazy danych
W drugiej części zapoznasz się z przykładowymi danymi i wygenerujesz niektóre wykresy.
W trzeciej części dowiesz się, jak tworzyć funkcje na podstawie danych pierwotnych przy użyciu funkcji Transact-SQL. Następnie wywołasz tę funkcję z procedury składowanej, aby utworzyć tabelę zawierającą wartości funkcji.
W czwartej części załadujesz moduły i wywołasz niezbędne funkcje, aby utworzyć i wytrenować model przy użyciu procedury składowanej programu SQL Server.
W części piątej dowiesz się, jak operacjonalizować modele, które zostały wytrenowane i zapisane w części czwartej.
Uwaga / Notatka
Ten samouczek jest dostępny zarówno w języku R, jak i Python. Aby zapoznać się z wersją języka R, zobacz R tutorial: Predict NYC taxi fares with binary classification (Samouczek języka R: przewidywanie taryf taksówek w Nowym Jorku przy użyciu klasyfikacji binarnej).
Wymagania wstępne
Przywracanie bazy danych demonstracyjnej NYC Taxi
Wszystkie zadania można wykonywać przy użyciu Transact-SQL procedur składowanych w narzędziu Azure Data Studio lub Management Studio.
W tej serii samouczków założono, że posiadasz znajomość podstawowych operacji na bazach danych, takich jak tworzenie baz danych i tabel, importowanie danych i pisanie zapytań SQL. Nie zakłada się, że znasz język Python i podano cały kod w języku Python.
Tło dla programistów SQL
Proces tworzenia rozwiązania uczenia maszynowego jest złożony, który może obejmować wiele narzędzi oraz koordynację ekspertów w różnych fazach:
- uzyskiwanie i czyszczenie danych
- eksplorowanie danych i tworzenie funkcji przydatnych do modelowania
- trenowanie i dostrajanie modelu
- wdrażanie w środowisku produkcyjnym
Programowanie i testowanie rzeczywistego kodu najlepiej wykonać przy użyciu dedykowanego środowiska programistycznego. Jednak po pełnym przetestowaniu skryptu można go łatwo wdrożyć w programie SQL Server przy użyciu Transact-SQL procedur składowanych w znanym środowisku programu Azure Data Studio lub Management Studio. Zawijanie kodu zewnętrznego w procedurach składowanych jest podstawowym mechanizmem operacjonalizacji kodu w programie SQL Server.
Po zapisaniu modelu w bazie danych można wywołać model przewidywania z Transact-SQL przy użyciu procedur składowanych.
Niezależnie od tego, czy jesteś programistą SQL, który dopiero zaczyna przygodę z językiem Python, czy programistą Python, który jest nowy w SQL, w pięciu częściach serii samouczków przedstawiono typowy przepływ pracy do przeprowadzania analizy w bazie danych przy użyciu języka Python i SQL Server.
Dalsze kroki
W tym artykule dowiesz się:
- Zainstalowane wymagania wstępne
- Przywrócono przykładową bazę danych