Not
Åtkomst till denna sida kräver auktorisation. Du kan prova att logga in eller byta katalog.
Åtkomst till denna sida kräver auktorisation. Du kan prova att byta katalog.
Gäller för: SQL Server 2017 (14.x) och senare versioner
Azure SQL Managed Instance
I den här självstudieserien i fyra delar använder du Python för att utveckla och distribuera en K-Means-klustermodell i SQL Server Machine Learning Services eller i stordatakluster för att kategorisera kunddata.
I den här självstudieserien i fyra delar använder du Python för att utveckla och distribuera en K-Means-klustermodell i SQL Server Machine Learning Services för att klustra kunddata.
I den här självstudieserien i fyra delar använder du Python för att utveckla och distribuera en K-Means-klustermodell i Azure SQL Managed Instance Machine Learning Services för att klustra kunddata.
I den första delen av den här serien ställer du in förutsättningarna för handledningen och återställer sedan en exempel datauppsättning i en databas. Senare i den här serien använder du dessa data för att träna och distribuera en klustermodell i Python med SQL-maskininlärning.
I del två och tre i den här serien utvecklar du vissa Python-skript i en Azure Data Studio-notebook-fil för att analysera och förbereda dina data och träna en maskininlärningsmodell. Kör sedan Python-skripten i en databas i del fyra med hjälp av lagrade procedurer.
Klustring kan förklaras som att organisera data i grupper där medlemmar i en grupp på något sätt liknar dem. Anta att du äger ett detaljhandelsföretag i den här självstudieserien. Använd K-Means-algoritmen för att utföra klustring av kunder i en datauppsättning med produktinköp och returer. Genom att segmentera kunder kan du fokusera marknadsföring mer effektivt genom att rikta in dig på specifika grupper. K-Means-klustring är en oövervakad inlärningsalgoritm som söker efter mönster i data baserat på likheter.
I den här artikeln lär du dig att:
- Återställa en exempeldatabas
I del två får du lära dig hur du förbereder data från en databas för att utföra klustring.
I del tre får du lära dig hur du skapar och tränar en K-Means-klustermodell i Python.
I del fyra får du lära dig hur du skapar en lagrad procedur i en databas som kan utföra klustring i Python baserat på nya data.
Förutsättningar
- SQL Server Machine Learning Services med python-språkalternativet – Följ installationsanvisningarna i Installationsguiden för Windows eller Linux-installationsguiden.
- SQL Server Machine Learning Services med python-språkalternativet – Följ installationsanvisningarna i Installationsguiden för Windows eller Linux-installationsguiden. Du kan också aktivera Machine Learning Services på SQL Server Big Data Clusters.
- SQL Server Machine Learning Services med python-språkalternativet – Följ installationsanvisningarna i Installationsguiden för Windows.
Azure SQL Managed Instance Machine Learning Services. Mer information finns i Översikt över Azure SQL Managed Instance Machine Learning Services.
SQL Server Management Studio (SSMS) för återställning av exempeldatabasen till Azure SQL Managed Instance.
Azure Data Studio. Använd en notebook-fil i Azure Data Studio för både Python och SQL. Mer information om notebook-filer finns i Använda notebook-filer i Azure Data Studio.
Ytterligare Python-paket – Exemplen i den här självstudieserien använder Python-paket som du kanske eller kanske inte har installerat.
Öppna en Administrativ Kommandoprompt och navigera till installationsmappen för den version av Python som du använder i Azure Data Studio. Till exempel
cd %LocalAppData%\Programs\Python\Python37-32. Kör sedan följande kommandon för att installera något av de här paketen som inte redan är installerade. Kontrollera att dessa paket är installerade på rätt Plats för Python-installationen. Du kan använda alternativet-tför att ange målkatalogen.pip install matplotlib pip install pandas pip install pyodbc pip install scipy pip install scikit-learn
Kör följande icacls-kommandon för att ge READ & EXECUTE-åtkomst till de installerade biblioteken till SQL Server Launchpad Service och SID S-1-15-2-1 (ALL_APPLICATION_PACKAGES).
icacls "C:\Program Files\Python310\Lib\site-packages" /grant "NT Service\MSSQLLAUNCHPAD":(OI)(CI)RX /T
icacls "C:\Program Files\Python310\Lib\site-packages" /grant *S-1-15-2-1:(OI)(CI)RX /T
Återställa exempeldatabasen
Exempeldatauppsättningen som används i den här självstudien har sparats i en .bak databassäkerhetskopieringsfil som du kan ladda ned och använda. Den här datamängden härleds från tpcx-bb-datamängden som tillhandahålls av TPC (Transaction Processing Performance Council).
Anmärkning
Om du använder Machine Learning Services på stordatakluster kan du läsa om hur du återställer en databas till SQL Server-huvudinstansen för stordatakluster.
Ladda ned filen tpcxbb_1gb.bak.
Följ anvisningarna i Återställa en databas från en säkerhetskopia i Azure Data Studio med hjälp av följande information:
- Importera från filen
tpcxbb_1gb.baksom du laddade ned. - Ge måldatabasen namnet
tpcxbb_1gb.
- Importera från filen
Du kan kontrollera att datamängden finns när du har återställt databasen genom att fråga tabellen
dbo.customer:USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Ladda ned filen tpcxbb_1gb.bak.
Följ anvisningarna i Återställa en databas till en SQL Managed Instance i SQL Server Management Studio med hjälp av följande information:
- Importera från filen
tpcxbb_1gb.baksom du laddade ned. - Ge måldatabasen namnet
tpcxbb_1gb.
- Importera från filen
Du kan kontrollera att datamängden finns när du har återställt databasen genom att fråga tabellen
dbo.customer:USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Rensa resurser
Om du inte ska fortsätta med den här självstudien, bör du ta bort databasen tpcxbb_1gb.
Nästa steg
I del ett av den här självstudieserien har du slutfört följande steg:
- Återställa en exempeldatabas
Om du vill förbereda data för maskininlärningsmodellen följer du del två i den här självstudieserien: