Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Naučte se používat Visual Studio Code (VS Code) k psaní kódu Pythonu, R a C# za pomocí U-SQL a odesílání úloh do služby Azure Data Lake. Další informace o nástrojích Azure Data Lake pro VS Code najdete v tématu Použití nástrojů Azure Data Lake pro Visual Studio Code.
Před psaním uživatelského kódu v rámci code-behind je nutné otevřít složku nebo pracovní prostor ve VS Code.
Požadavky pro Python a R
Zaregistrujte sestavení rozšíření Python a R pro váš účet ADL.
Otevřete svůj účet na portálu.
- Vyberte Přehled.
- Vyberte ukázkový skript.
Vyberte Další.
Vyberte Nainstalovat rozšíření U-SQL.
Po instalaci rozšíření U-SQL se zobrazí potvrzovací zpráva.
Poznámka:
Pro zajištění nejlepších zkušeností se službou jazyka Python a R nainstalujte rozšíření VSCode Python a R.
Vývoj souboru Pythonu
Vyberte Nový soubor v pracovním prostoru.
Napište svůj kód v U-SQL. Následuje ukázka kódu.
REFERENCE ASSEMBLY [ExtPython]; @t = SELECT * FROM (VALUES ("D1","T1","A1","@foo Hello World @bar"), ("D2","T2","A2","@baz Hello World @beer") ) AS D( date, time, author, tweet ); @m = REDUCE @t ON date PRODUCE date string, mentions string USING new Extension.Python.Reducer("pythonSample.usql.py", pyVersion : "3.5.1"); OUTPUT @m TO "/tweetmentions.csv" USING Outputters.Csv();Klikněte pravým tlačítkem myši na soubor skriptu a pak vyberte ADL: Vygenerování kódu Pythonu za souborem.
Soubor xxx.usql.py se vygeneruje ve vaší pracovní složce. Napište svůj kód do souboru Pythonu. Následuje ukázka kódu.
def get_mentions(tweet): return ';'.join( ( w[1:] for w in tweet.split() if w[0]=='@' ) ) def usqlml_main(df): del df['time'] del df['author'] df['mentions'] = df.tweet.apply(get_mentions) del df['tweet'] return dfKlikněte pravým tlačítkem na soubor USQL, můžete vybrat Kompilovat skript nebo Odeslat úlohu pro spuštění.
Vývoj souboru R
Vyberte Nový soubor v pracovním prostoru.
Napište svůj kód do souboru U-SQL. Následuje ukázka kódu.
DEPLOY RESOURCE @"/usqlext/samples/R/my_model_LM_Iris.rda"; DECLARE @IrisData string = @"/usqlext/samples/R/iris.csv"; DECLARE @OutputFilePredictions string = @"/my/R/Output/LMPredictionsIris.txt"; DECLARE @PartitionCount int = 10; @InputData = EXTRACT SepalLength double, SepalWidth double, PetalLength double, PetalWidth double, Species string FROM @IrisData USING Extractors.Csv(); @ExtendedData = SELECT Extension.R.RandomNumberGenerator.GetRandomNumber(@PartitionCount) AS Par, SepalLength, SepalWidth, PetalLength, PetalWidth FROM @InputData; // Predict Species @RScriptOutput = REDUCE @ExtendedData ON Par PRODUCE Par, fit double, lwr double, upr double READONLY Par USING new Extension.R.Reducer(scriptFile : "RClusterRun.usql.R", rReturnType : "dataframe", stringsAsFactors : false); OUTPUT @RScriptOutput TO @OutputFilePredictions USING Outputters.Tsv();Klikněte pravým tlačítkem na soubor USQL a pak vyberte ADL: Vygenerovat R Code Behind File.
Soubor xxx.usql.r se vygeneruje ve vaší pracovní složce. Napište svůj kód do souboru R. Následuje ukázka kódu.
load("my_model_LM_Iris.rda") outputToUSQL=data.frame(predict(lm.fit, inputFromUSQL, interval="confidence"))Klikněte pravým tlačítkem na soubor USQL, můžete vybrat Kompilovat skript nebo Odeslat úlohu pro spuštění.
Vývoj souboru C#
Soubor s kódem je soubor jazyka C# přidružený k jednomu skriptu U-SQL. V souboru kódu můžete definovat skript vyhrazený pro UDO, UDA, UDT a UDF. UDO, UDA, UDT a UDF se dají použít přímo ve skriptu bez registrace sestavení. Soubor kódu se umístí do stejné složky jako jeho spárovaný U-SQL skript. Pokud má skript název xxx.usql, kód na pozadí je pojmenován xxx.usql.cs. Pokud ručně odstraníte soubor code-behind, funkce code-behind je pro přidružený skript U-SQL zakázána. Další informace o psaní kódu zákazníka pro skript U-SQL naleznete v tématu Psaní a používání vlastního kódu v U-SQL: User-Defined Functions.
Vyberte Nový soubor v pracovním prostoru.
Napište svůj kód do souboru U-SQL. Následuje ukázka kódu.
@a = EXTRACT Iid int, Starts DateTime, Region string, Query string, DwellTime int, Results string, ClickedUrls string FROM @"/Samples/Data/SearchLog.tsv" USING Extractors.Tsv(); @d = SELECT DISTINCT Region FROM @a; @d1 = PROCESS @d PRODUCE Region string, Mkt string USING new USQLApplication_codebehind.MyProcessor(); OUTPUT @d1 TO @"/output/SearchLogtest.txt" USING Outputters.Tsv();Klikněte pravým tlačítkem na soubor USQL a pak vyberte ADL: Vygenerovat kód CS za souborem.
Soubor xxx.usql.cs se vygeneruje ve vaší pracovní složce. Napište svůj kód do souboru CS. Následuje ukázka kódu.
namespace USQLApplication_codebehind { [SqlUserDefinedProcessor] public class MyProcessor : IProcessor { public override IRow Process(IRow input, IUpdatableRow output) { output.Set(0, input.Get<string>(0)); output.Set(1, input.Get<string>(0)); return output.AsReadOnly(); } } }Klikněte pravým tlačítkem na soubor USQL, můžete vybrat Kompilovat skript nebo Odeslat úlohu pro spuštění.
Další kroky
- Použití nástrojů Azure Data Lake pro Visual Studio Code
- Místní spuštění U-SQL a místní ladění pomocí editoru Visual Studio Code
- Začínáme s Data Lake Analytics pomocí PowerShellu
- Začínáme se službou Data Lake Analytics pomocí webu Azure Portal
- Použití nástrojů Data Lake pro Visual Studio pro vývoj aplikací U-SQL
- Použití katalogu Data Lake Analytics (U-SQL)