Megosztás a következőn keresztül:


R-oktatóanyag: NYC taxidíjak előrejelzése bináris besorolással

A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók felügyelt Azure SQL-példány

Ebben az ötrészes oktatóanyag-sorozatban, amely SQL-programozóknak szól, megismerheti, hogyan integrálható az R az SQL Server Machine Learning Services környezetébe vagy a Big Data Clusters rendszereibe.

Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az R-integrációt az SQL Server Machine Learning Servicesben.

Az SQL-programozók számára készült ötrészes oktatóanyag-sorozatban megismerheti az SQL Server 2016 R Services R-integrációját.

Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az R-integrációt a Machine Learning Servicesben a felügyelt Azure SQL-példányban.

Egy R-alapú gépi tanulási megoldást fog létrehozni és üzembe helyezni egy mintaadatbázis használatával az SQL Serveren. Ön fogja használni a T-SQL-t, az Azure Data Studio-t vagy az SQL Server Management Studio-t, valamint egy adatbázismotor-példányt SQL gépi tanulás és R nyelvi támogatással.

Ez az oktatóanyag-sorozat bemutatja az adatmodellezési munkafolyamatokban használt R-függvényeket. A részek közé tartozik az adatfeltárás, a bináris besorolási modell létrehozása és betanítása, valamint a modell üzembe helyezése. A New York-i Taxi és Limousine Bizottság mintaadatait fogja használni. A model, amelyet felépítesz, előrejelzi, hogy az utazás valószínűleg eredményez-e borravalót a napszak, a megtett távolság és az átvételi hely alapján.

A sorozat első részében telepíti az előfeltételeket, és visszaállítja a mintaadatbázist. A második és a harmadik részben R-szkripteket fog kifejleszteni az adatok előkészítéséhez és egy gépi tanulási modell betanítása érdekében. Ezután a negyedik és az ötödik részben azokat az R-szkripteket fogja futtatni az adatbázisban, amelyek T-SQL-ben tárolt eljárásokat használnak.

Ebben a cikkben a következőket fogja megismerni:

  • Előfeltételek telepítése
  • A mintaadatbázis visszaállítása

A második részben megismerheti a mintaadatokat, és létrehozhat néhány diagramot.

A harmadik részben megtanulhatja, hogyan hozhat létre funkciókat nyers adatokból egy Transact-SQL függvény használatával. Ezután meghívja ezt a függvényt egy tárolt eljárásból, hogy létrehozhasson egy táblát, amely tartalmazza a funkcióértékeket.

A negyedik részben betölti a modulokat, és meghívja a szükséges függvényeket a modell létrehozásához és betanítása egy SQL Server által tárolt eljárás használatával.

Az ötödik részben megtanulhatja, hogyan lehet üzembe helyezni a negyedik részben betanított és mentett modelleket.

Megjegyzés:

Ez az oktatóanyag R-ben és Pythonban is elérhető. A Python-verzióhoz lásd a Python-oktatóanyagot: NyC taxidíjak előrejelzése bináris besorolással.

Előfeltételek

Minden feladat elvégezhető Transact-SQL tárolt eljárások használatával az Azure Data Studióban vagy a Management Studióban.

Ez az oktatóanyag feltételezi az alapvető adatbázis-műveletek, például az adatbázisok és táblák létrehozását, az adatok importálását és az SQL-lekérdezések írását. Nem feltételezi, hogy ismeri az R-t, és minden R-kód meg van adva.

Háttér SQL-fejlesztőknek

A gépi tanulási megoldás létrehozásának folyamata egy összetett folyamat, amely több eszközt is magában foglalhat, és a téma szakértőinek koordinálása több fázisban:

  • adatok beszerzése és tisztítása
  • az adatok feltárása és a modellezéshez hasznos funkciók létrehozása
  • a modell betanítása és finomhangolása
  • üzembe helyezés éles környezetben

A tényleges kód fejlesztése és tesztelése a legjobban egy dedikált R fejlesztői környezet használatával végezhető el. A szkript teljes tesztelése után azonban egyszerűen üzembe helyezheti az SQL Serveren Transact-SQL tárolt eljárások használatával az Azure Data Studio vagy a Management Studio ismerős környezetében. A külső kód burkolása a tárolt eljárásokban a kód SQL Serveren való üzembe helyezése elsődleges mechanizmusa.

Miután mentette a modellt az adatbázisba, tárolt eljárások használatával meghívhatja a modellt az Transact-SQL előrejelzéseihez.

Akár SQL programozó vagy, aki új az R-ben, akár R fejlesztő, aki új az SQL-ben, ez az ötrészes oktatóanyag-sorozat bemutatja a tipikus munkafolyamatot, amely az adatbázison belüli elemzések elvégzésére szolgál R-rel és SQL Serverrel.

Következő lépések

Ebben a cikkben a következőt találja:

  • Telepített előfeltételek
  • A mintaadatbázis visszaállítása