Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy: SQL Server 2017 (14.x) i nowsze wersje
usługi Azure SQL Managed Instance
W tej czteroczęściowej serii samouczków użyj języka Python do opracowania i wdrożenia modelu klastrowania K-Średnich w usługach SQL Server Machine Learning Services lub w klastrach danych big data w celu kategoryzowania danych klientów.
W tej czteroczęściowej serii samouczków użyj języka Python do opracowania i wdrożenia modelu K-Means w SQL Server Machine Learning Services, aby przeprowadzić klastrowanie danych klientów.
W tej serii czterech samouczków użyj języka Python, aby opracować i wdrożyć model klastrowania K-Means w usługach Azure SQL Managed Instance Machine Learning Services do klastrowania danych klientów.
W części jednej z tej serii skonfiguruj wymagania wstępne dotyczące samouczka, a następnie przywróć przykładowy zestaw danych do bazy danych. W dalszej części tej serii użyj tych danych, aby wytrenować i wdrożyć model klastrowania w języku Python przy użyciu uczenia maszynowego SQL.
W dwóch i trzech częściach tej serii opracuj niektóre skrypty języka Python w notesie usługi Azure Data Studio, aby analizować i przygotowywać dane oraz szkolić model uczenia maszynowego. Następnie w czwartej części uruchom te skrypty języka Python wewnątrz bazy danych przy użyciu procedur składowanych.
Klastrowanie można wyjaśnić jako organizowanie danych w grupach, w których członkowie grupy są w jakiś sposób podobne. W tej serii samouczków wyobraź sobie, że jesteś właścicielem firmy handlu detalicznego. Użyj algorytmu K-Means, aby wykonać klastrowanie klientów w zestawie danych zakupów i zwrotów produktów. Dzięki klastrowaniu klientów możesz bardziej efektywnie skoncentrować swoje wysiłki marketingowe, kierując się do określonych grup. Klaster K-Średnich to nienadzorowany algorytm uczenia , który wyszukuje wzorce w danych na podstawie podobieństw.
Z tego artykułu dowiesz się, jak wykonywać następujące działania:
- Przywracanie przykładowej bazy danych
W drugiej części dowiesz się, jak przygotować dane z bazy danych do wykonywania klastrowania.
W trzeciej części dowiesz się, jak utworzyć i wytrenować model klastrowania K-Średnich w języku Python.
W czwartej części dowiesz się, jak utworzyć procedurę składowaną w bazie danych, która może wykonywać klastrowanie w języku Python na podstawie nowych danych.
Wymagania wstępne
- Usługi SQL Server Machine Learning Services z opcją języka Python — postępuj zgodnie z instrukcjami instalacji w przewodniku instalacji systemu Windows lub przewodniku instalacji systemu Linux.
- Usługi SQL Server Machine Learning Services z opcją języka Python — postępuj zgodnie z instrukcjami instalacji w przewodniku instalacji systemu Windows lub przewodniku instalacji systemu Linux. Usługi Machine Learning Services można również włączyć w klastrach danych big data programu SQL Server.
- Usługi SQL Server Machine Learning Services z opcją języka Python — postępuj zgodnie z instrukcjami instalacji w przewodniku instalacji systemu Windows.
Azure SQL Managed Instance Machine Learning Services. Aby uzyskać informacje, zobacz Omówienie usług Azure SQL Managed Instance Machine Learning Services.
Program SQL Server Management Studio (SSMS) umożliwiający przywrócenie przykładowej bazy danych do usługi Azure SQL Managed Instance.
Azure Data Studio. Użyj notesu w narzędziu Azure Data Studio zarówno dla języka Python, jak i sql. Aby uzyskać więcej informacji na temat notatników, zobacz Jak używać notatników w Azure Data Studio (How to use notebooks in Azure Data Studio).
Dodatkowe pakiety języka Python — przykłady z tej serii samouczków używają pakietów języka Python, które możesz mieć zainstalowane lub nie.
Otwórz wiersz polecenia administracyjnego i przejdź do ścieżki instalacji dla wersji języka Python używanej w narzędziu Azure Data Studio. Na przykład
cd %LocalAppData%\Programs\Python\Python37-32. Następnie uruchom następujące polecenia, aby zainstalować dowolne z tych pakietów, które nie zostały jeszcze zainstalowane. Upewnij się, że te pakiety są zainstalowane w prawidłowej lokalizacji instalacji języka Python. Możesz użyć opcji-t, aby określić katalog docelowy.pip install matplotlib pip install pandas pip install pyodbc pip install scipy pip install scikit-learn
Uruchom następujące polecenia
icacls "C:\Program Files\Python310\Lib\site-packages" /grant "NT Service\MSSQLLAUNCHPAD":(OI)(CI)RX /T
icacls "C:\Program Files\Python310\Lib\site-packages" /grant *S-1-15-2-1:(OI)(CI)RX /T
Przywracanie przykładowej bazy danych
Przykładowy zestaw danych używany w tym samouczku został zapisany w pliku kopii zapasowej bazy danych .bak do pobrania i użycia. Ten zestaw danych pochodzi z zestawu danych tpcx-bb dostarczonego przez Radę wydajności przetwarzania transakcji (TPC).
Uwaga / Notatka
Jeśli używasz usług Machine Learning Services w klastrach danych big-data, zobacz, jak przywrócić bazę danych do głównej instancji klastra danych big-data programu SQL Server.
Pobierz plik tpcxbb_1gb.bak.
Postępuj zgodnie z instrukcjami w artykule Przywracanie bazy danych z pliku kopii zapasowej w narzędziu Azure Data Studio, korzystając z następujących szczegółów:
- Zaimportuj z pobranego
tpcxbb_1gb.bakpliku. - Nadaj docelowej bazie danych
tpcxbb_1gbnazwę .
- Zaimportuj z pobranego
Możesz sprawdzić, czy zestaw danych istnieje po przywróceniu bazy danych, wykonując
dbo.customerzapytanie dotyczące tabeli:USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Pobierz plik tpcxbb_1gb.bak.
Postępuj zgodnie z instrukcjami w artykule Przywracanie bazy danych do wystąpienia zarządzanego SQL w programie SQL Server Management Studio, korzystając z następujących szczegółów:
- Zaimportuj z pobranego
tpcxbb_1gb.bakpliku. - Nadaj docelowej bazie danych
tpcxbb_1gbnazwę .
- Zaimportuj z pobranego
Możesz sprawdzić, czy zestaw danych istnieje po przywróceniu bazy danych, wykonując
dbo.customerzapytanie dotyczące tabeli:USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Uprzątnij zasoby
Jeśli nie zamierzasz kontynuować pracy z tym samouczkiem, usuń tpcxbb_1gb bazę danych.
Następny krok
W jednej części tej serii samouczków wykonano następujące kroki:
- Przywracanie przykładowej bazy danych
Aby przygotować dane dla modelu uczenia maszynowego, wykonaj drugą część tej serii samouczków: