Aracılığıyla paylaş


Öğretici: SQL Server verileriyle RevoScaleR R işlevlerini kullanma

Şunlar için geçerlidir: SQL Server 2016 (13.x) ve sonraki sürümleri

Bu çok bölümlü öğretici serisinde, veri bilimiyle ilişkili görevler için bir dizi RevoScaleR işleviyle tanıştırıldınız. Bu süreçte, uzak işlem bağlamı oluşturmayı, verileri yerel ve uzak işlem bağlamları arasında taşımayı ve uzak SQL Server'da R kodunu yürütmeyi öğreneceksiniz. Ayrıca verileri hem yerel olarak hem de uzak sunucuda analiz etmeyi ve çizmeyi ve model oluşturmayı ve dağıtmayı öğreneceksiniz.

RevoScaleR , veri bilimi ve makine öğrenmesi iş yükleri için dağıtılmış ve paralel işleme sağlayan bir Microsoft R paketidir. SQL Server'da R geliştirme için RevoScaleR , veri kaynağı nesneleri oluşturma, işlem bağlamı ayarlama, paketleri yönetme ve en önemlisi: içeri aktarmadan görselleştirmeye ve analize kadar uçtan uca verilerle çalışma işlevlerine sahip temel yerleşik paketlerden biridir. SQL Server'daki Machine Learning algoritmalarının RevoScaleR veri kaynaklarına bağımlılığı vardır. RevoScaleR'ın önemi göz önünde bulundurulduğunda işlevlerini ne zaman ve nasıl çağıracaklarını bilmek temel bir beceridir.

Önkoşullar

Yerel ve uzak işlem bağlamları arasında geçiş yapmak için iki sistem gerekir. Yerel genellikle veri bilimi iş yükleri için yeterli güce sahip bir geliştirme iş istasyonudur. SQL Server, bu durumda, R özelliği etkinleştirilmiş olarak uzaktan erişilmektedir.

İşlem bağlamlarının değiştirilmesi, hem yerel hem de uzak sistemlerde aynı sürüme sahip RevoScaleR'ın bulunması ön koşuldur. Yerel bir iş istasyonunda, Microsoft R İstemcisi'ni yükleyerek RevoScaleR paketlerini ve ilgili sağlayıcıları alabilirsiniz.

İstemciyi ve sunucuyu aynı bilgisayara yerleştirmeniz gerekiyorsa, bir "uzak" istemciden R betiği göndermek için ikinci bir Microsoft R kitaplıkları kümesi yüklediğinizden emin olun. SQL Server örneğinin program dosyalarına yüklenen R kitaplıklarını kullanmayın. Özellikle, tek bir bilgisayar kullanıyorsanız, istemci ve sunucu işlemlerini desteklemek için bu konumların her ikisinde de RevoScaleR kitaplığına ihtiyacınız vardır.

  • C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
  • C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR

İstemci yapılandırmasıyla ilgili yönergeler için bkz. R geliştirme için veri bilimi istemcisi ayarlama.

R geliştirme araçları

R geliştiricileri genellikle R kodu yazmak ve hata ayıklamak için IDE'leri kullanır. Aşağıda bazı öneriler verilmiştir:

  • Visual Studio için R Araçları (RTVS), Microsoft R için IntelliSense, hata ayıklama ve destek sağlayan ücretsiz bir eklentidir. SQL Server Machine Learning Services ile kullanabilirsiniz. İndirmek için bkz. Visual Studio için R Araçları.

  • RStudio, R geliştirme için en popüler ortamlardan biridir. Daha fazla bilgi için bkz. https://www.rstudio.com/products/RStudio/.

  • SQL Server veya R İstemcisi'ne R yüklediğinizde temel R araçları (R.exe, RTerm.exe, RScripts.exe) de varsayılan olarak yüklenir. IDE yüklemek istemiyorsanız, bu öğreticideki kodu yürütmek için yerleşik R araçlarını kullanabilirsiniz.

RevoScaleR'ın hem yerel hem de uzak bilgisayarlarda gerekli olduğunu hatırlayın. RStudio'nun genel yüklemesini veya Microsoft R kitaplıkları eksik olan başka bir ortamı kullanarak bu öğreticiyi tamamlayamazsınız. Daha fazla bilgi için bkz. Veri Bilimi İstemcisi Ayarlama.

Görevlerin özeti

  • Veriler başlangıçta CSV dosyalarından veya XDF dosyalarından alınır. RevoScaleR paketindeki işlevleri kullanarak verileri SQL Server'a aktarırsınız.
  • Model eğitimi ve puanlama, SQL Server işlem bağlamı kullanılarak gerçekleştirilir.
  • Puanlama sonuçlarınızı kaydetmek üzere yeni SQL Server tabloları oluşturmak için RevoScaleR işlevlerini kullanın.
  • Hem sunucuda hem de yerel işlem bağlamında çizimler oluşturun.
  • SQL Server örneğinde R çalıştırarak SQL Server veritabanındaki veriler üzerinde model eğitin.
  • Verilerin bir alt kümesini ayıklayın ve yerel iş istasyonunuzda analizde yeniden kullanmak üzere XDF dosyası olarak kaydedin.
  • SQL Server veritabanına odbc bağlantısı açarak puanlama için yeni veriler alın. Puanlama yerel iş istasyonunda yapılır.
  • Bir benzetimi gerçekleştirmek için özel bir R işlevi oluşturun ve bunu sunucu işlem bağlamında çalıştırın.

Sonraki Adımlar