Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op: SQL Server 2016 (13.x) en latere versies
van Azure SQL Managed Instance
In deze quickstart leert u hoe u R-functies voor wiskundige en hulpprogramma's gebruikt met SQL Server Machine Learning Services of op Big Data-clusters. Statistische functies zijn vaak ingewikkeld om te implementeren in T-SQL, maar kunnen worden uitgevoerd in R met slechts een paar regels code.
In deze quickstart leert u hoe u wiskundige R- en hulpprogrammafuncties gebruikt met SQL Server Machine Learning Services. Statistische functies zijn vaak ingewikkeld om te implementeren in T-SQL, maar kunnen worden uitgevoerd in R met slechts een paar regels code.
In deze quickstart leert u hoe u wiskundige R- en hulpprogrammafuncties gebruikt met SQL Server R Services. Statistische functies zijn vaak ingewikkeld om te implementeren in T-SQL, maar kunnen worden uitgevoerd in R met slechts een paar regels code.
In deze quickstart leert u hoe u gegevensstructuren en gegevenstypen gebruikt wanneer u R gebruikt in Azure SQL Managed Instance Machine Learning Services. U leert hoe u gegevens verplaatst tussen R en SQL Managed Instance en de veelvoorkomende problemen die kunnen optreden.
Vereiste voorwaarden
U hebt de volgende vereisten nodig om deze quickstart uit te voeren.
- SQL Server Machine Learning Services. Als u Machine Learning Services wilt installeren, raadpleegt u de Windows-installatiehandleiding of de Linux-installatiehandleiding. U kunt Machine Learning Services ook inschakelen op BIG Data-clusters van SQL Server.
- SQL Server Machine Learning Services. Als u Machine Learning Services wilt installeren, raadpleegt u de Windows-installatiehandleiding.
- SQL Server 2016 R Services. Als u R Services wilt installeren, raadpleegt u de Windows-installatiehandleiding.
- Azure SQL Managed Instance Machine Learning Services. Zie het overzicht van Azure SQL Managed Instance Machine Learning Services voor meer informatie.
- Een hulpprogramma voor het uitvoeren van SQL-query's die R-scripts bevatten. In deze quickstart wordt Gebruikgemaakt van Azure Data Studio.
Een opgeslagen procedure maken om willekeurige getallen te genereren
Voor het gemak gebruiken we het R-pakket stats , dat standaard is geïnstalleerd en geladen. Het pakket bevat honderden functies voor algemene statistische taken, waaronder de rnorm functie, die een opgegeven aantal willekeurige getallen genereert met behulp van de normale verdeling, op basis van een standaarddeviatie en een gemiddelde.
De volgende R-code retourneert bijvoorbeeld 100 getallen op een gemiddelde van 50, op basis van een standaarddeviatie van 3.
as.data.frame(rnorm(100, mean = 50, sd = 3));
Als u deze regel van R vanuit T-SQL wilt aanroepen, voegt u de R-functie toe in de R-scriptparameter van sp_execute_external_script, zoals deze:
EXECUTE sp_execute_external_script
@language = N'R'
, @script = N'
OutputDataSet <- as.data.frame(rnorm(100, mean = 50, sd =3));'
, @input_data_1 = N' ;'
WITH RESULT SETS (([Density] float NOT NULL));
Wat moet u doen als u het eenvoudiger wilt maken om een andere set willekeurige getallen te genereren?
Dat is eenvoudig in combinatie met T-SQL. U definieert een opgeslagen procedure die de argumenten van de gebruiker ophaalt en deze argumenten vervolgens als variabelen doorgeeft aan het R-script.
CREATE PROCEDURE MyRNorm (
@param1 INT
, @param2 INT
, @param3 INT
)
AS
EXECUTE sp_execute_external_script @language = N'R'
, @script = N'
OutputDataSet <- as.data.frame(rnorm(mynumbers, mymean, mysd));'
, @input_data_1 = N' ;'
, @params = N' @mynumbers int, @mymean int, @mysd int'
, @mynumbers = @param1
, @mymean = @param2
, @mysd = @param3
WITH RESULT SETS(([Density] FLOAT NOT NULL));
De eerste regel definieert elk van de SQL-invoerparameters die vereist zijn wanneer de opgeslagen procedure wordt uitgevoerd.
De regel die begint met
@paramsdefinieert alle variabelen die worden gebruikt door de R-code en de bijbehorende SQL-gegevenstypen.De regels die direct volgen, wijzen de SQL-parameternamen toe aan de bijbehorende R-variabelenamen.
Nu u de R-functie in een opgeslagen procedure hebt verpakt, kunt u de functie eenvoudig aanroepen en verschillende waarden doorgeven, zoals deze:
EXECUTE MyRNorm @param1 = 100,@param2 = 50, @param3 = 3
R-hulpprogrammafuncties gebruiken voor probleemoplossing
Het hulpprogrammapakket , standaard geïnstalleerd, biedt diverse hulpprogrammafuncties voor het onderzoeken van de huidige R-omgeving. Deze functies kunnen handig zijn als u verschillen vindt in de manier waarop uw R-code wordt uitgevoerd in SQL Server en in externe omgevingen.
U kunt bijvoorbeeld de functies voor systeemtijdsinstellingen in R gebruiken, zoals system.time en proc.time, om de tijd vast te leggen die wordt gebruikt door R-processen en prestatieproblemen te analyseren. Zie voor een voorbeeld de zelfstudie Gegevensfuncties maken waarin R-timingfuncties zijn ingesloten in de oplossing.
EXECUTE sp_execute_external_script
@language = N'R'
, @script = N'
library(utils);
start.time <- proc.time();
# Run R processes
elapsed_time <- proc.time() - start.time;'
Zie R-codeprofileringsfuncties gebruiken om de prestaties te verbeteren voor andere nuttige functies.
Volgende stappen
Volg deze quickstart om een machine learning-model te maken met behulp van R met SQL Machine Learning: