Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók
felügyelt Azure SQL-példány
Ebben a négyrészes oktatóanyag-sorozatban R használatával fejleszthet és üzembe helyezhet egy K-Means klaszterezési modellt az SQL Server Machine Learning Services szolgáltatásokban vagy Big Data klasztereken az ügyféladatok kategorizálásához.
Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az SQL Server Machine Learning Servicesben az ügyféladatok fürtözésére.
Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az SQL Server R Servicesben az ügyféladatok fürtözésére.
Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az Azure SQL Managed Instance Machine Learning Servicesben az ügyféladatok fürtözéséhez.
A sorozat első részében beállítja az oktatóanyag előfeltételeit, majd visszaállít egy mintaadatkészletet egy adatbázisba. A második és a harmadik részben R-szkripteket fog kifejleszteni egy Azure Data Studio-jegyzetfüzetben, hogy elemezze és előkészítse ezeket a mintaadatokat, és betanítson egy gépi tanulási modellt. Ezután a negyedik részben ezeket az R-szkripteket egy adatbázisban fogja futtatni tárolt eljárásokkal.
A klaszterezés magyarázata az adatok olyan csoportokba szervezése, amelyekben egy csoport tagjai valamilyen módon hasonlóak. Ebben az oktatóanyag-sorozatban képzelje el, hogy kiskereskedelmi vállalkozása van. A K-Means algoritmussal végezheti el az ügyfelek fürtözését a termékvásárlások és -visszaküldések adathalmazában. Az ügyfelek klaszterezésével hatékonyabban összpontosíthatja marketingtevékenységeit adott csoportok megcélzásával. A K-Means fürtözés egy nem felügyelt tanulási algoritmus, amely hasonlóságok alapján keres mintákat az adatokban.
Ebben a cikkben megtudhatja, hogyan:
- Mintaadatbázis visszaállítása
A második részben megtanulhatja, hogyan készítheti elő az adatokat egy adatbázisból a fürtözés végrehajtására.
A harmadik részben megtanulhatja, hogyan hozhat létre és taníthat be K-Means fürtözési modellt az R-ben.
A negyedik részben megtanulhatja, hogyan hozhat létre tárolt eljárást egy olyan adatbázisban, amely új adatok alapján képes fürtözést végezni az R-ben.
Előfeltételek
- SQL Server Machine Learning Services a Python nyelvi beállítással – Kövesse a Windows telepítési útmutatójában vagy a Linux telepítési útmutatójában található telepítési utasításokat. A Machine Learning Servicest az SQL Server Big Data-fürtökön is engedélyezheti.
- SQL Server Machine Learning Services az R nyelvi beállítással – Kövesse a Windows telepítési útmutatójában található telepítési utasításokat.
Azure SQL Managed Instance Machine Learning Services. További információt az Azure SQL Managed Instance Machine Learning Services áttekintésében talál.
SQL Server Management Studio (SSMS) – Az SSMS használatával visszaállíthatja a mintaadatbázist a felügyelt Azure SQL-példányra. Telepítse az SQL Server Management Studio (SSMS) legújabb verzióját.
Azure Data Studio. Jegyzetfüzetet fog használni az Azure Data Studio for SQL-ben. A jegyzetfüzetekkel kapcsolatos további információkért lásd: Jegyzetfüzetek használata az Azure Data Studióban.
R IDE – Ez az oktatóanyag az RStudio Desktopot használja.
RODBC – Ez az illesztőprogram az ebben az oktatóanyagban fejlesztendő R-szkriptekben használatos. Ha még nincs telepítve, telepítse az R paranccsal
install.packages("RODBC"). További információ az RODBC-ről: CRAN – Package RODBC.
A mintaadatbázis visszaállítása
Az oktatóanyagban használt mintaadatkészlet egy adatbázis biztonsági mentési fájlba .bak lett mentve, amelyet letölthet és használhat. Ez az adatkészlet a Transaction Processing Performance Council (TPC) által biztosított tpcx-bb adatkészletből származik.
Megjegyzés:
Ha a Machine Learning szolgáltatásokat Big Data-fürtökön használja, tekintse meg, hogyan állíthatja vissza az adatbázist az SQL Server big data-fürt főpéldányába.
Töltse le a fájlt tpcxbb_1gb.bak.
Kövesse az Azure Data Studio biztonsági mentési fájljából származó adatbázis visszaállítása című útmutató útmutatását az alábbi részletekkel:
- Importálás a
tpcxbb_1gb.bakletöltött fájlból. - Nevezze el a céladatbázist
tpcxbb_1gb.
- Importálás a
Ellenőrizheti, hogy a dataset létezik-e az adatbázis visszaállítása után a
dbo.customertábla lekérdezésével.USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Töltse le a fájlt tpcxbb_1gb.bak.
Kövesse az SQL Server Management Studióban az adatbázis visszaállítása felügyelt példányra című útmutató útmutatását az alábbi részletekkel:
- Importálás a
tpcxbb_1gb.bakletöltött fájlból. - Nevezze el a céladatbázist
tpcxbb_1gb.
- Importálás a
Ellenőrizheti, hogy a dataset létezik-e az adatbázis visszaállítása után a
dbo.customertábla lekérdezésével.USE tpcxbb_1gb; SELECT * FROM [dbo].[customer];
Erőforrások tisztítása
Ha nem folytatja ezt az oktatóanyagot, törölje az adatbázist tpcxbb_1gb .
Következő lépés
Az oktatóanyag-sorozat első részében az alábbi lépéseket hajtotta végre:
- Az előfeltételek telepítése
- Mintaadatbázis visszaállítása
A gépi tanulási modell adatainak előkészítéséhez kövesse az oktatóanyag-sorozat második részét: