Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók
felügyelt Azure SQL-példány
Ebben az ötrészes oktatóanyag-sorozatban, amely SQL-programozóknak szól, megismerheti, hogyan integrálható az R az SQL Server Machine Learning Services környezetébe vagy a Big Data Clusters rendszereibe.
Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az R-integrációt az SQL Server Machine Learning Servicesben.
Az SQL-programozók számára készült ötrészes oktatóanyag-sorozatban megismerheti az SQL Server 2016 R Services R-integrációját.
Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az R-integrációt a Machine Learning Servicesben a felügyelt Azure SQL-példányban.
Egy R-alapú gépi tanulási megoldást fog létrehozni és üzembe helyezni egy mintaadatbázis használatával az SQL Serveren. Ön fogja használni a T-SQL-t, az Azure Data Studio-t vagy az SQL Server Management Studio-t, valamint egy adatbázismotor-példányt SQL gépi tanulás és R nyelvi támogatással.
Ez az oktatóanyag-sorozat bemutatja az adatmodellezési munkafolyamatokban használt R-függvényeket. A részek közé tartozik az adatfeltárás, a bináris besorolási modell létrehozása és betanítása, valamint a modell üzembe helyezése. A New York-i Taxi és Limousine Bizottság mintaadatait fogja használni. A model, amelyet felépítesz, előrejelzi, hogy az utazás valószínűleg eredményez-e borravalót a napszak, a megtett távolság és az átvételi hely alapján.
A sorozat első részében telepíti az előfeltételeket, és visszaállítja a mintaadatbázist. A második és a harmadik részben R-szkripteket fog kifejleszteni az adatok előkészítéséhez és egy gépi tanulási modell betanítása érdekében. Ezután a negyedik és az ötödik részben azokat az R-szkripteket fogja futtatni az adatbázisban, amelyek T-SQL-ben tárolt eljárásokat használnak.
Ebben a cikkben a következőket fogja megismerni:
- Előfeltételek telepítése
- A mintaadatbázis visszaállítása
A második részben megismerheti a mintaadatokat, és létrehozhat néhány diagramot.
A harmadik részben megtanulhatja, hogyan hozhat létre funkciókat nyers adatokból egy Transact-SQL függvény használatával. Ezután meghívja ezt a függvényt egy tárolt eljárásból, hogy létrehozhasson egy táblát, amely tartalmazza a funkcióértékeket.
A negyedik részben betölti a modulokat, és meghívja a szükséges függvényeket a modell létrehozásához és betanítása egy SQL Server által tárolt eljárás használatával.
Az ötödik részben megtanulhatja, hogyan lehet üzembe helyezni a negyedik részben betanított és mentett modelleket.
Megjegyzés:
Ez az oktatóanyag R-ben és Pythonban is elérhető. A Python-verzióhoz lásd a Python-oktatóanyagot: NyC taxidíjak előrejelzése bináris besorolással.
Előfeltételek
- Az SQL Server 2016 R Services telepítése
- Az SQL Server 2019-től kezdődően az elkülönítési mechanizmushoz megfelelő engedélyeket kell adnia ahhoz a könyvtárhoz, amelyben a diagramfájl található. Az engedélyek beállításáról további információt a Windows SQL Server 2019 Fájlengedélyek szakaszában talál: A Machine Learning Services elkülönítési változásai.
- A NYC Taxi bemutató adatbázisának visszaállítása
Minden feladat elvégezhető Transact-SQL tárolt eljárások használatával az Azure Data Studióban vagy a Management Studióban.
Ez az oktatóanyag feltételezi az alapvető adatbázis-műveletek, például az adatbázisok és táblák létrehozását, az adatok importálását és az SQL-lekérdezések írását. Nem feltételezi, hogy ismeri az R-t, és minden R-kód meg van adva.
Háttér SQL-fejlesztőknek
A gépi tanulási megoldás létrehozásának folyamata egy összetett folyamat, amely több eszközt is magában foglalhat, és a téma szakértőinek koordinálása több fázisban:
- adatok beszerzése és tisztítása
- az adatok feltárása és a modellezéshez hasznos funkciók létrehozása
- a modell betanítása és finomhangolása
- üzembe helyezés éles környezetben
A tényleges kód fejlesztése és tesztelése a legjobban egy dedikált R fejlesztői környezet használatával végezhető el. A szkript teljes tesztelése után azonban egyszerűen üzembe helyezheti az SQL Serveren Transact-SQL tárolt eljárások használatával az Azure Data Studio vagy a Management Studio ismerős környezetében. A külső kód burkolása a tárolt eljárásokban a kód SQL Serveren való üzembe helyezése elsődleges mechanizmusa.
Miután mentette a modellt az adatbázisba, tárolt eljárások használatával meghívhatja a modellt az Transact-SQL előrejelzéseihez.
Akár SQL programozó vagy, aki új az R-ben, akár R fejlesztő, aki új az SQL-ben, ez az ötrészes oktatóanyag-sorozat bemutatja a tipikus munkafolyamatot, amely az adatbázison belüli elemzések elvégzésére szolgál R-rel és SQL Serverrel.
Következő lépések
Ebben a cikkben a következőt találja:
- Telepített előfeltételek
- A mintaadatbázis visszaállítása