Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
platí pro: SQL Server 2016 (13.x) a novější verze
V této vícedílné sérii kurzů se seznámíte s řadou funkcí RevoScaleR pro úlohy spojené s datovými vědami. V tomto procesu se dozvíte, jak vytvořit vzdálený výpočetní kontext, přesouvat data mezi místními a vzdálenými výpočetními kontexty a spouštět kód R na vzdáleném SQL Serveru. Dozvíte se také, jak analyzovat a vykreslovat data místně i na vzdáleném serveru a jak vytvářet a nasazovat modely.
RevoScaleR je balíček Microsoft R poskytující distribuované a paralelní zpracování úloh datových věd a strojového učení. Pro vývoj R na SQL Serveru je RevoScaleR jedním z základních integrovaných balíčků, s funkcemi pro vytváření objektů zdroje dat, nastavením výpočetního kontextu, správou balíčků a nejdůležitějšími: práce s daty na konci, od importu po vizualizaci a analýzu. Algoritmy strojového učení v SQL Serveru mají závislost na zdrojích dat RevoScaleR . Vzhledem k důležitosti RevoScaleR je znalost toho, kdy a jak volat její funkce, základní dovedností.
Požadavky
SQL Server Machine Learning Services s funkcí jazyka R nebo službou SQL Server R Services (v databázi)
Oprávnění k databázi a přihlášení uživatele databáze SQL Serveru
Integrované vývojové prostředí (IDE), jako je RStudio nebo integrovaný nástroj RGUI, který je součástí jazyka R
Pokud chcete přepínat mezi místním a vzdáleným výpočetním kontextem, potřebujete dva systémy. Místní prostředí je obvykle vývojová pracovní stanice s dostatečným výkonem pro pracovní úlohy v oblasti datové vědy. V tomto případě je vzdáleným serverem SQL Server s aktivovanou funkcí R.
Přepínání výpočetních kontextů je založené na tom, že RevoScaleR má stejnou verzi v místních i vzdálených systémech. Na místní pracovní stanici lze získat balíčky RevoScaleR a související zprostředkovatele instalací klienta Microsoft R.
Pokud potřebujete umístit klienta a server na stejný počítač, nezapomeňte nainstalovat druhou sadu knihoven Microsoft R pro odesílání skriptu R ze vzdáleného klienta. Nepoužívejte knihovny jazyka R nainstalované v programových souborech instance SQL Serveru. Konkrétně pokud používáte jeden počítač, potřebujete knihovnu RevoScaleR v obou těchto umístěních pro podporu operací klienta a serveru.
- C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
- C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR
Pokyny ke konfiguraci klienta najdete v tématu Nastavení klienta pro vývoj datových věd pro jazyk R.
Vývojové nástroje jazyka R
Vývojáři jazyka R obvykle používají integrované vývojová prostředí pro psaní a ladění kódu R. Zde jsou některé návrhy:
R Tools for Visual Studio (RTVS) je bezplatný modul plug-in, který poskytuje intellisense, ladění a podporu pro Microsoft R. Můžete ho použít se službami SQL Server Machine Learning Services. Pokud si ho chcete stáhnout, přečtěte si téma Nástroje jazyka R pro Visual Studio.
RStudio je jedním z nejoblíbenějších prostředí pro vývoj jazyka R. Další informace najdete v tématu RStudio.
Základní nástroje R (R.exe, RTerm.exe, RScripts.exe) se také instalují ve výchozím nastavení při instalaci jazyka R na SQL Server nebo R Client. Pokud nechcete nainstalovat integrované vývojové prostředí (IDE), můžete pomocí integrovaných nástrojů R spustit kód v tomto kurzu.
Vzpomeňte si, že RevoScaleR se vyžaduje na místních i vzdálených počítačích. Tento kurz nelze dokončit pomocí obecné instalace RStudio nebo jiného prostředí, ve které chybí knihovny Microsoft R. Další informace naleznete v tématu Nastavení Data Science klienta.
Souhrn úkolů
- Data se zpočátku získávají ze souborů CSV nebo souborů XDF. Data naimportujete do SQL Serveru pomocí funkcí v balíčku RevoScaleR .
- Trénování a vyhodnocování modelů se provádí pomocí výpočetního kontextu SQL Serveru.
- Pomocí funkcí RevoScaleR můžete vytvořit nové tabulky SQL Serveru pro uložení výsledků vyhodnocování.
- Vytvořte grafy na serveru i v místním výpočetním kontextu.
- Trénujte model na datech v databázi SQL Serveru a spusťte R v instanci SQL Serveru.
- Extrahujte podmnožinu dat a uložte je jako soubor XDF pro opakované použití při analýze na místní pracovní stanici.
- Získejte nová data pro bodování otevřením připojení ODBC k databázi SQL Serveru. Bodování se provádí na místní pracovní stanici.
- Vytvořte vlastní funkci R a spusťte ji ve výpočetním kontextu serveru, abyste mohli provést simulaci.