Aracılığıyla paylaş


Öğretici: SQL makine öğrenmesi ile R'de tahmine dayalı bir model eğitmek için verileri hazırlama

Şunlar için geçerlidir: SQL Server 2016 (13.x) ve sonraki sürümleri Azure SQL Yönetilen Örnek

Bu dört bölümden oluşan öğretici serisinin ikinci bölümünde, R kullanarak veritabanından veri hazırlayacaksınız. Bu serinin ilerleyen bölümlerinde, SQL Server Machine Learning Services ile R'de veya Büyük Veri Kümelerinde tahmine dayalı bir model eğitmek ve dağıtmak için bu verileri kullanacaksınız.

Bu dört bölümden oluşan öğretici serisinin ikinci bölümünde, R kullanarak veritabanından veri hazırlayacaksınız. Bu serinin ilerleyen bölümlerinde, SQL Server Machine Learning Services ile R'de tahmine dayalı bir model eğitmek ve dağıtmak için bu verileri kullanacaksınız.

Bu dört bölümden oluşan öğretici serisinin ikinci bölümünde, R kullanarak veritabanından veri hazırlayacaksınız. Bu serinin ilerleyen bölümlerinde, SQL Server R Services ile R'de tahmine dayalı bir model eğitmek ve dağıtmak için bu verileri kullanacaksınız.

Bu dört bölümden oluşan öğretici serisinin ikinci bölümünde, R kullanarak veritabanından veri hazırlayacaksınız. Bu serinin ilerleyen bölümlerinde, Azure SQL Yönetilen Örneği Machine Learning Services ile R'de tahmine dayalı bir model eğitmek ve dağıtmak için bu verileri kullanacaksınız.

Bu makalede şunları nasıl yapacağınızı öğreneceksiniz:

  • Örnek veritabanını veritabanına geri yükleme
  • Veritabanındaki verileri R veri çerçevesine yükleme
  • Bazı sütunları kategorik olarak tanımlayarak R'de verileri hazırlama

Birinci bölümde örnek veritabanını geri yüklemeyi öğrendinsiniz.

Üçüncü bölümde R'de makine öğrenmesi modelini eğitmeyi öğreneceksiniz.

Dördüncü bölümde, modeli bir veritabanında depolamayı öğrenecek ve ardından ikinci ve üç bölümde geliştirdiğiniz R betiklerinden saklı yordamlar oluşturacaksınız. Saklı yordamlar, yeni verilere dayalı tahminler yapmak için sunucuda çalışır.

Önkoşullar

Bu öğreticinin ikinci bölümünde birinci bölümü ve önkoşullarını tamamladığınız varsayılır.

Verileri bir veri çerçevesine yükleme

R'deki verileri kullanmak için veritabanındaki verileri bir veri çerçevesine (rentaldata ) yükleyeceksiniz.

RStudio'da yeni bir RScript dosyası oluşturun ve aşağıdaki betiği çalıştırın. ServerName değerini kendi bağlantı bilgilerinizle değiştirin.

#Define the connection string to connect to the TutorialDB database
connStr <- "Driver=SQL Server;Server=ServerName;Database=TutorialDB;uid=Username;pwd=Password"


#Get the data from the table
library(RODBC)

ch <- odbcDriverConnect(connStr)

#Import the data from the table
rentaldata <- sqlFetch(ch, "dbo.rental_data")

#Take a look at the structure of the data and the top rows
head(rentaldata)
str(rentaldata)

Aşağıdakine benzer sonuçlar görmeniz gerekir.

   Year  Month  Day  RentalCount  WeekDay  Holiday  Snow
1  2014    1     20      445         2        1      0
2  2014    2     13       40         5        0      0
3  2013    3     10      456         1        0      0
4  2014    3     31       38         2        0      0
5  2014    4     24       23         5        0      0
6  2015    2     11       42         4        0      0
'data.frame':       453 obs. of  7 variables:
$ Year       : int  2014 2014 2013 2014 2014 2015 2013 2014 2013 2015 ...
$ Month      : num  1 2 3 3 4 2 4 3 4 3 ...
$ Day        : num  20 13 10 31 24 11 28 8 5 29 ...
$ RentalCount: num  445 40 456 38 23 42 310 240 22 360 ...
$ WeekDay    : num  2 5 1 2 5 4 1 7 6 1 ...
$ Holiday    : int  1 0 0 0 0 0 0 0 0 0 ...
$ Snow       : num  0 0 0 0 0 0 0 0 0 0 ...

Verileri hazırlama

Bu örnek veritabanında, hazırlama işleminin çoğu zaten yapılmıştır, ancak burada bir hazırlık daha yapacaksınız. Veri türlerini faktör olarak değiştirerek üç sütunu kategori olarak tanımlamak için aşağıdaki R betiğini kullanın.

#Changing the three factor columns to factor types
rentaldata$Holiday <- factor(rentaldata$Holiday);
rentaldata$Snow    <- factor(rentaldata$Snow);
rentaldata$WeekDay <- factor(rentaldata$WeekDay);



#Visualize the dataset after the change
str(rentaldata);

Aşağıdakine benzer sonuçlar görmeniz gerekir.

data.frame':      453 obs. of  7 variables:
$ Year       : int  2014 2014 2013 2014 2014 2015 2013 2014 2013 2015 ...
$ Month      : num  1 2 3 3 4 2 4 3 4 3 ...
$ Day        : num  20 13 10 31 24 11 28 8 5 29 ...
$ RentalCount: num  445 40 456 38 23 42 310 240 22 360 ...
$ WeekDay    : Factor w/ 7 levels "1","2","3","4",..: 2 5 1 2 5 4 1 7 6 1 ...
$ Holiday    : Factor w/ 2 levels "0","1": 2 1 1 1 1 1 1 1 1 1 ...
$ Snow       : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...

Veriler artık eğitim için hazırlanmıştır.

Kaynakları temizle

Bu öğreticiye devam etmeyecekseniz TutorialDB veritabanını silin.

Sonraki Adımlar

Bu öğretici serisinin ikinci bölümünde şunların nasıl yapılacağını öğrendiniz:

  • Örnek verileri R veri çerçevesine yükleme
  • Bazı sütunları kategorik olarak tanımlayarak R'de verileri hazırlama

TutorialDB veritabanındaki verileri kullanan bir makine öğrenmesi modeli oluşturmak için bu öğretici serisinin üçüncü bölümünü izleyin: