Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók
felügyelt Azure SQL-példány
A négyrészes oktatóanyag-sorozat második részében az R használatával készíti elő az adatokat egy adatbázisból. A sorozat későbbi részében ezekkel az adatokkal betaníthat és üzembe helyezhet egy prediktív modellt az R-ben az SQL Server Machine Learning Services vagy a Big Data-fürtök használatával.
A négyrészes oktatóanyag-sorozat második részében az R használatával készíti elő az adatokat egy adatbázisból. A sorozat későbbi részében ezekkel az adatokkal betaníthat és üzembe helyezhet egy prediktív modellt az R-ben az SQL Server Machine Learning Services használatával.
A négyrészes oktatóanyag-sorozat második részében az R használatával készíti elő az adatokat egy adatbázisból. A sorozat későbbi részében ezekkel az adatokkal betaníthat és üzembe helyezhet egy prediktív modellt az R-ben az SQL Server R Services használatával.
A négyrészes oktatóanyag-sorozat második részében az R használatával készíti elő az adatokat egy adatbázisból. A sorozat későbbi részében ezekkel az adatokkal betaníthat és üzembe helyezhet egy prediktív modellt az R-ben az Azure SQL Managed Instance Machine Learning Services használatával.
Ebben a cikkben megtudhatja, hogyan:
- Mintaadatbázis visszaállítása adatbázisba
- Az adatok betöltése az adatbázisból egy R-adatkeretbe
- Az adatok előkészítése az R-ben egyes oszlopok kategorikusként való azonosításával
Az első részben megtanulta, hogyan állíthatja vissza a mintaadatbázist.
A harmadik részben megtanulhatja, hogyan taníthat be gépi tanulási modellt az R-ben.
A negyedik részben megtanulhatja, hogyan tárolhatja a modellt egy adatbázisban, majd hogyan hozhat létre tárolt eljárásokat a második és harmadik részben kifejlesztett R-szkriptekből. A tárolt eljárások a kiszolgálón futnak, hogy új adatok alapján előrejelzéseket készítsenek.
Előfeltételek
Az oktatóanyag második része feltételezi, hogy elvégezte az első részt és annak előfeltételeit.
Adatok betöltése adatkeretbe
Az adatok R-ben való használatához az adatbázisból származó adatokat egy adatkeretbe (rentaldata) kell betöltenie.
Hozzon létre egy új RScript-fájlt az RStudio-ban, és futtassa a következő szkriptet. Cserélje le a ServerName nevet a saját kapcsolati adataira.
#Define the connection string to connect to the TutorialDB database
connStr <- "Driver=SQL Server;Server=ServerName;Database=TutorialDB;uid=Username;pwd=Password"
#Get the data from the table
library(RODBC)
ch <- odbcDriverConnect(connStr)
#Import the data from the table
rentaldata <- sqlFetch(ch, "dbo.rental_data")
#Take a look at the structure of the data and the top rows
head(rentaldata)
str(rentaldata)
Az alábbihoz hasonló eredményeket kell látnia.
Year Month Day RentalCount WeekDay Holiday Snow
1 2014 1 20 445 2 1 0
2 2014 2 13 40 5 0 0
3 2013 3 10 456 1 0 0
4 2014 3 31 38 2 0 0
5 2014 4 24 23 5 0 0
6 2015 2 11 42 4 0 0
'data.frame': 453 obs. of 7 variables:
$ Year : int 2014 2014 2013 2014 2014 2015 2013 2014 2013 2015 ...
$ Month : num 1 2 3 3 4 2 4 3 4 3 ...
$ Day : num 20 13 10 31 24 11 28 8 5 29 ...
$ RentalCount: num 445 40 456 38 23 42 310 240 22 360 ...
$ WeekDay : num 2 5 1 2 5 4 1 7 6 1 ...
$ Holiday : int 1 0 0 0 0 0 0 0 0 0 ...
$ Snow : num 0 0 0 0 0 0 0 0 0 0 ...
Az adatok előkészítése
Ebben a mintaadatbázisban a legtöbb előkészítés már befejeződött, de itt még egy előkészítést fog elvégezni. Az alábbi R-szkripttel három oszlopot azonosíthat kategóriákként az adattípusok tényezőre való módosításával.
#Changing the three factor columns to factor types
rentaldata$Holiday <- factor(rentaldata$Holiday);
rentaldata$Snow <- factor(rentaldata$Snow);
rentaldata$WeekDay <- factor(rentaldata$WeekDay);
#Visualize the dataset after the change
str(rentaldata);
Az alábbihoz hasonló eredményeket kell látnia.
data.frame': 453 obs. of 7 variables:
$ Year : int 2014 2014 2013 2014 2014 2015 2013 2014 2013 2015 ...
$ Month : num 1 2 3 3 4 2 4 3 4 3 ...
$ Day : num 20 13 10 31 24 11 28 8 5 29 ...
$ RentalCount: num 445 40 456 38 23 42 310 240 22 360 ...
$ WeekDay : Factor w/ 7 levels "1","2","3","4",..: 2 5 1 2 5 4 1 7 6 1 ...
$ Holiday : Factor w/ 2 levels "0","1": 2 1 1 1 1 1 1 1 1 1 ...
$ Snow : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
Az adatok most fel lettek készítve a tréningre.
Erőforrások tisztítása
Ha nem folytatja ezt az oktatóanyagot, törölje a TutorialDB-adatbázist.
Következő lépések
Az oktatóanyag-sorozat második részében megtanulta, hogyan:
- A mintaadatok betöltése R-adatkeretbe
- Az adatok előkészítése az R-ben egyes oszlopok kategorikusként való azonosításával
A TutorialDB-adatbázisból származó adatokat használó gépi tanulási modell létrehozásához kövesse az oktatóanyag-sorozat harmadik részét: