Sdílet prostřednictvím


Kurz: Použití funkcí RevoScaleR R s daty SQL Serveru

platí pro: SQL Server 2016 (13.x) a novější verze

V této vícedílné sérii kurzů se seznámíte s řadou funkcí RevoScaleR pro úlohy spojené s datovými vědami. V tomto procesu se dozvíte, jak vytvořit vzdálený výpočetní kontext, přesouvat data mezi místními a vzdálenými výpočetními kontexty a spouštět kód R na vzdáleném SQL Serveru. Dozvíte se také, jak analyzovat a vykreslovat data místně i na vzdáleném serveru a jak vytvářet a nasazovat modely.

RevoScaleR je balíček Microsoft R poskytující distribuované a paralelní zpracování úloh datových věd a strojového učení. Pro vývoj R na SQL Serveru je RevoScaleR jedním z základních integrovaných balíčků, s funkcemi pro vytváření objektů zdroje dat, nastavením výpočetního kontextu, správou balíčků a nejdůležitějšími: práce s daty na konci, od importu po vizualizaci a analýzu. Algoritmy strojového učení v SQL Serveru mají závislost na zdrojích dat RevoScaleR . Vzhledem k důležitosti RevoScaleR je znalost toho, kdy a jak volat její funkce, základní dovedností.

Požadavky

Pokud chcete přepínat mezi místním a vzdáleným výpočetním kontextem, potřebujete dva systémy. Místní prostředí je obvykle vývojová pracovní stanice s dostatečným výkonem pro pracovní úlohy v oblasti datové vědy. V tomto případě je vzdáleným serverem SQL Server s aktivovanou funkcí R.

Přepínání výpočetních kontextů je založené na tom, že RevoScaleR má stejnou verzi v místních i vzdálených systémech. Na místní pracovní stanici lze získat balíčky RevoScaleR a související zprostředkovatele instalací klienta Microsoft R.

Pokud potřebujete umístit klienta a server na stejný počítač, nezapomeňte nainstalovat druhou sadu knihoven Microsoft R pro odesílání skriptu R ze vzdáleného klienta. Nepoužívejte knihovny jazyka R nainstalované v programových souborech instance SQL Serveru. Konkrétně pokud používáte jeden počítač, potřebujete knihovnu RevoScaleR v obou těchto umístěních pro podporu operací klienta a serveru.

  • C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
  • C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR

Pokyny ke konfiguraci klienta najdete v tématu Nastavení klienta pro vývoj datových věd pro jazyk R.

Vývojové nástroje jazyka R

Vývojáři jazyka R obvykle používají integrované vývojová prostředí pro psaní a ladění kódu R. Zde jsou některé návrhy:

  • R Tools for Visual Studio (RTVS) je bezplatný modul plug-in, který poskytuje intellisense, ladění a podporu pro Microsoft R. Můžete ho použít se službami SQL Server Machine Learning Services. Pokud si ho chcete stáhnout, přečtěte si téma Nástroje jazyka R pro Visual Studio.

  • RStudio je jedním z nejoblíbenějších prostředí pro vývoj jazyka R. Další informace najdete v tématu RStudio.

  • Základní nástroje R (R.exe, RTerm.exe, RScripts.exe) se také instalují ve výchozím nastavení při instalaci jazyka R na SQL Server nebo R Client. Pokud nechcete nainstalovat integrované vývojové prostředí (IDE), můžete pomocí integrovaných nástrojů R spustit kód v tomto kurzu.

Vzpomeňte si, že RevoScaleR se vyžaduje na místních i vzdálených počítačích. Tento kurz nelze dokončit pomocí obecné instalace RStudio nebo jiného prostředí, ve které chybí knihovny Microsoft R. Další informace naleznete v tématu Nastavení Data Science klienta.

Souhrn úkolů

  • Data se zpočátku získávají ze souborů CSV nebo souborů XDF. Data naimportujete do SQL Serveru pomocí funkcí v balíčku RevoScaleR .
  • Trénování a vyhodnocování modelů se provádí pomocí výpočetního kontextu SQL Serveru.
  • Pomocí funkcí RevoScaleR můžete vytvořit nové tabulky SQL Serveru pro uložení výsledků vyhodnocování.
  • Vytvořte grafy na serveru i v místním výpočetním kontextu.
  • Trénujte model na datech v databázi SQL Serveru a spusťte R v instanci SQL Serveru.
  • Extrahujte podmnožinu dat a uložte je jako soubor XDF pro opakované použití při analýze na místní pracovní stanici.
  • Získejte nová data pro bodování otevřením připojení ODBC k databázi SQL Serveru. Bodování se provádí na místní pracovní stanici.
  • Vytvořte vlastní funkci R a spusťte ji ve výpočetním kontextu serveru, abyste mohli provést simulaci.

Další kroky