Megosztás a következőn keresztül:


Oktatóanyag: Fürtözési modell fejlesztése az R-ben SQL gépi tanulás alkalmazásával

A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók felügyelt Azure SQL-példány

Ebben a négyrészes oktatóanyag-sorozatban R használatával fejleszthet és üzembe helyezhet egy K-Means klaszterezési modellt az SQL Server Machine Learning Services szolgáltatásokban vagy Big Data klasztereken az ügyféladatok kategorizálásához.

Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az SQL Server Machine Learning Servicesben az ügyféladatok fürtözésére.

Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az SQL Server R Servicesben az ügyféladatok fürtözésére.

Ebben a négyrészes oktatóanyag-sorozatban az R használatával fejleszthet és helyezhet üzembe egy K-Means fürtözési modellt az Azure SQL Managed Instance Machine Learning Servicesben az ügyféladatok fürtözéséhez.

A sorozat első részében beállítja az oktatóanyag előfeltételeit, majd visszaállít egy mintaadatkészletet egy adatbázisba. A második és a harmadik részben R-szkripteket fog kifejleszteni egy Azure Data Studio-jegyzetfüzetben, hogy elemezze és előkészítse ezeket a mintaadatokat, és betanítson egy gépi tanulási modellt. Ezután a negyedik részben ezeket az R-szkripteket egy adatbázisban fogja futtatni tárolt eljárásokkal.

A klaszterezés magyarázata az adatok olyan csoportokba szervezése, amelyekben egy csoport tagjai valamilyen módon hasonlóak. Ebben az oktatóanyag-sorozatban képzelje el, hogy kiskereskedelmi vállalkozása van. A K-Means algoritmussal végezheti el az ügyfelek fürtözését a termékvásárlások és -visszaküldések adathalmazában. Az ügyfelek klaszterezésével hatékonyabban összpontosíthatja marketingtevékenységeit adott csoportok megcélzásával. A K-Means fürtözés egy nem felügyelt tanulási algoritmus, amely hasonlóságok alapján keres mintákat az adatokban.

Ebben a cikkben megtudhatja, hogyan:

  • Mintaadatbázis visszaállítása

A második részben megtanulhatja, hogyan készítheti elő az adatokat egy adatbázisból a fürtözés végrehajtására.

A harmadik részben megtanulhatja, hogyan hozhat létre és taníthat be K-Means fürtözési modellt az R-ben.

A negyedik részben megtanulhatja, hogyan hozhat létre tárolt eljárást egy olyan adatbázisban, amely új adatok alapján képes fürtözést végezni az R-ben.

Előfeltételek

A mintaadatbázis visszaállítása

Az oktatóanyagban használt mintaadatkészlet egy adatbázis biztonsági mentési fájlba .bak lett mentve, amelyet letölthet és használhat. Ez az adatkészlet a Transaction Processing Performance Council (TPC) által biztosított tpcx-bb adatkészletből származik.

Megjegyzés:

Ha a Machine Learning szolgáltatásokat Big Data-fürtökön használja, tekintse meg, hogyan állíthatja vissza az adatbázist az SQL Server big data-fürt főpéldányába.

  1. Töltse le a fájlt tpcxbb_1gb.bak.

  2. Kövesse az Azure Data Studio biztonsági mentési fájljából származó adatbázis visszaállítása című útmutató útmutatását az alábbi részletekkel:

    • Importálás a tpcxbb_1gb.bak letöltött fájlból.
    • Nevezze el a céladatbázist tpcxbb_1gb.
  3. Ellenőrizheti, hogy a dataset létezik-e az adatbázis visszaállítása után a dbo.customer tábla lekérdezésével.

    USE tpcxbb_1gb;
    SELECT * FROM [dbo].[customer];
    
  1. Töltse le a fájlt tpcxbb_1gb.bak.

  2. Kövesse az SQL Server Management Studióban az adatbázis visszaállítása felügyelt példányra című útmutató útmutatását az alábbi részletekkel:

    • Importálás a tpcxbb_1gb.bak letöltött fájlból.
    • Nevezze el a céladatbázist tpcxbb_1gb.
  3. Ellenőrizheti, hogy a dataset létezik-e az adatbázis visszaállítása után a dbo.customer tábla lekérdezésével.

    USE tpcxbb_1gb;
    SELECT * FROM [dbo].[customer];
    

Erőforrások tisztítása

Ha nem folytatja ezt az oktatóanyagot, törölje az adatbázist tpcxbb_1gb .

Következő lépés

Az oktatóanyag-sorozat első részében az alábbi lépéseket hajtotta végre:

  • Az előfeltételek telepítése
  • Mintaadatbázis visszaállítása

A gépi tanulási modell adatainak előkészítéséhez kövesse az oktatóanyag-sorozat második részét: