Not
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
gäller för: SQL Server 2016 (13.x) och senare versioner
I den här självstudien för dataexperter får du lära dig hur du skapar en lösning från slutpunkt till slutpunkt för förutsägelsemodellering baserat på stöd för R-funktioner i SQL Server 2016 eller SQL Server 2017. I denna självstudie används en databas med namnet NYCTaxi_sample på SQL Server.
Du använder en kombination av R-kod, SQL Server-data och anpassade SQL-funktioner för att bygga en klassificeringsmodell som anger sannolikheten att föraren kanske får dricks på en viss taxiresa. Du distribuerar även R-modellen till SQL Server och använder serverdata för att generera poäng baserat på modellen.
Det här exemplet kan utökas till alla typer av verkliga problem, till exempel förutsäga kundsvar på säljkampanjer eller förutsäga utgifter eller närvaro vid evenemang. Eftersom modellen kan anropas från en lagrad procedur kan du enkelt bädda in den i ett program.
Eftersom genomgången är utformad för att introducera R-utvecklare till R Services (In-Database), används R där det är möjligt. Detta innebär dock inte att R nödvändigtvis är det bästa verktyget för varje uppgift. I många fall kan SQL Server ge bättre prestanda, särskilt för uppgifter som dataaggregering och funktionsutveckling. Sådana uppgifter kan särskilt dra nytta av nya funktioner i SQL Server, till exempel minnesoptimerade kolumnlagringsindex. Vi försöker peka på möjliga optimeringar längs vägen.
Förutsättningar
SQL Server Machine Learning Services med R-integrering eller SQL Server 2016 R Services
Databasbehörigheter som beviljats en databasanvändare som mappats till en SQL Server-inloggning
En R IDE som RStudio eller det inbyggda RGUI-verktyget som ingår i R
Vi rekommenderar att du gör den här genomgången på en klientarbetsstation. Du måste kunna ansluta i samma nätverk till en SQL Server-dator med SQL Server och R-språket aktiverat. Anvisningar om konfiguration av arbetsstationer finns i Konfigurera en data science-klient för R-utveckling.
Du kan också köra genomgången på en dator som har både SQL Server och en R-utvecklingsmiljö, men vi rekommenderar inte den här konfigurationen för en produktionsmiljö. Om du behöver placera klienten och servern på samma dator måste du installera en andra uppsättning Microsoft R-bibliotek för att skicka R-skript från en fjärrklient. Använd inte de R-bibliotek som är installerade i programfilerna för SQL Server-instansen. Mer specifikt, om du använder en dator, behöver du RevoScaleR-biblioteket på båda dessa platser för att stödja klient- och serveråtgärder.
- C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
- C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR
Ytterligare R-paket
Den här genomgången kräver flera R-bibliotek som inte är installerade som standard som en del av R Services (In-Database). Du måste installera paketen både på klienten där du utvecklar lösningen och på den SQL Server-dator där du distribuerar lösningen.
På en klientarbetsstation
I R-miljön kopierar du följande rader och kör koden i ett konsolfönster (Rgui eller en IDE). Vissa paket installerar också nödvändiga paket. Totalt installeras cirka 32 paket. Du måste ha en Internetanslutning för att slutföra det här steget.
# Install required R libraries, if they are not already installed.
if (!('ggmap' %in% rownames(installed.packages()))){install.packages('ggmap')}
if (!('mapproj' %in% rownames(installed.packages()))){install.packages('mapproj')}
if (!('ROCR' %in% rownames(installed.packages()))){install.packages('ROCR')}
if (!('RODBC' %in% rownames(installed.packages()))){install.packages('RODBC')}
På servern
Du har flera alternativ för att installera paket på SQL Server. SQL Server tillhandahåller till exempel R-pakethanteringsfunktionen som gör att databasadministratörer kan skapa en paketlagringsplats och tilldela användaren behörighet att installera sina egna paket. Men om du är administratör på datorn kan du installera nya paket med hjälp av R, så länge du installerar i rätt bibliotek.
Anmärkning
Installera inte på ett användarbibliotek på servern även om du uppmanas att göra det. Om du installerar i ett användarbibliotek kan SQL Server-instansen inte hitta eller köra paketen. Mer information finns i Installera nya R-paket på SQL Server.
Öppna RGui.exe som administratör på SQL Server-datorn. Om du har installerat SQL Server R Services med standardvärdena finns Rgui.exe i C:\Program Files\Microsoft SQL Server\MSSQL13. MSSQLSERVER\R_SERVICES\bin\x64).
Kör följande R-kommandon i en R-prompt:
install.packages("ggmap", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("mapproj", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("ROCR", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("RODBC", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
I det här exemplet används funktionen R grep för att söka i vektorn för tillgängliga sökvägar och hitta sökvägen som innehåller "Programfiler". Mer information finns i RDocumentation för baspaketet.
Om du tror att paketen redan är installerade kontrollerar du listan över installerade paket genom att köra installed.packages().