Sdílet prostřednictvím


Co je samostatný Machine Learning Server nebo R Server v SQL Serveru?

platí pro: SQL Server 2016 (13.x) a novější verze

Důležité

Podpora pro Machine Learning Server (dříve označovaný jako R Server) skončila 1. července 2022. Další informace najdete v tématu Co se děje se službou Machine Learning Server?

SQL Server poskytuje podporu instalace pro samostatný R Server nebo Machine Learning Server, který běží nezávisle na SQL Serveru. V závislosti na vaší verzi SQL Serveru má samostatný server základ opensourcového jazyka R a případně Pythonu, který překryje vysoce výkonnými knihovnami od Microsoftu, které přidávají statistické a prediktivní analýzy ve velkém měřítku. Knihovny také umožňují úlohy strojového učení skriptované v jazyce R nebo Python.

V SQL Serveru 2016 se tato funkce nazývá R Server (samostatný) a je jen R. V SQL Serveru 2017 se nazývá Machine Learning Server (samostatný) a zahrnuje R i Python.

Poznámka:

Vzhledem k instalaci SQL Serveru je samostatný server funkčně ekvivalentní verzím Microsoft Machine Learning Serveru bez SQL, který podporuje stejné uživatelské scénáře, včetně vzdáleného spouštění, zprovoznění a webových služeb a kompletní kolekce knihoven R a Pythonu.

Součásti

SQL Server 2016 podporuje výhradně R. SQL Server 2017 podporuje R a Python. Následující tabulka popisuje funkce v jednotlivých verzích.

Součást Popis
Balíčky R RevoScaleR je primární knihovna škálovatelného jazyka R s funkcemi pro manipulaci s daty, transformací, vizualizací a analýzou.
MicrosoftML přidává algoritmy strojového učení pro vytváření vlastních modelů pro analýzu textu, analýzu obrázků a analýzu mínění.
sqlRUtils poskytuje pomocné funkce pro vkládání skriptů R do uložené procedury T-SQL, registraci uložené procedury v databázi a spuštění uložené procedury z vývojového prostředí jazyka R.
OLAPR slouží k určení dotazů MDX v jazyce R.
Microsoft R Open (MRO) Microsoft R Open (vyřazeno) byl opensourcová distribuce jazyka R od Microsoftu.
Nástroje jazyka R Okna konzoly R a příkazové řádky jsou standardní nástroje v distribuci jazyka R. Najdete je v umístění \Program files\Microsoft SQL Server\140\R_SERVER\bin\x64.
Ukázky a skripty jazyka R Opensourcové balíčky R a RevoScaleR zahrnují integrované sady dat, abyste mohli vytvářet a spouštět skripty pomocí předem nainstalovaných dat. Vyhledejte je v umístění \Program files\Microsoft SQL Server\140\R_SERVER\library\datasets a \library\RevoScaleR.
Balíčky Pythonu revoscalepy je primární knihovna pro škálovatelný Python s funkcemi pro manipulaci s daty, transformací, vizualizací a analýzou.
Microsoftml přidává algoritmy strojového učení k vytváření vlastních modelů pro analýzu textu, analýzu obrázků a analýzu mínění.
Nástroje Pythonu Integrovaný nástroj příkazového řádku Pythonu je užitečný pro ad hoc testování a úlohy. Najděte nástroj na adrese \Program files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe.
Anakonda Anaconda je opensourcová distribuce Pythonu a základních balíčků.
Ukázky a skripty Pythonu Stejně jako r python obsahuje integrované datové sady a skripty. Vyhledejte data revoscalepy v \Program Files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data.
Předem natrénované modely v R a Pythonu Předem vytrénované modely se vytvářejí pro konkrétní případy použití a udržují je technický tým datových věd v Microsoftu. Předem vytrénované modely můžete použít as-is k hodnocení pozitivního negativního mínění v textu nebo k detekci funkcí na obrázcích pomocí nových datových vstupů, které zadáte. Předem natrénované modely jsou podporované a použitelné na samostatném serveru, ale nemůžete je nainstalovat prostřednictvím instalace SQL Serveru. Další informace najdete v tématu Instalace předem natrénovaných modelů strojového učení na SQL Server.

Použití samostatného serveru

Vývojáři R a Python obvykle volí samostatný server, aby překonali omezení paměti a zpracování v open-source prostředí R a Pythonu. Knihovny R a Pythonu spuštěné na samostatném serveru můžou načítat a zpracovávat velké objemy dat na více jádrech a agregovat výsledky do jednoho konsolidovaného výstupu. Vysoce výkonné funkce jsou navrženy pro škálování i nástroje: poskytování prediktivní analýzy, statistického modelování, vizualizací dat a špičkových algoritmů strojového učení v komerčním serverovém produktu vytvořeném a podporovaném Microsoftem.

Jako nezávislý server oddělený od SQL Serveru je prostředí R a Python nakonfigurované, zabezpečené a přístupné pomocí základního operačního systému a standardních nástrojů poskytovaných na samostatném serveru, nikoli sql Serveru. Neexistuje žádná integrovaná podpora relačních dat SQL Serveru. Pokud chcete použít data SQL Serveru, můžete vytvořit objekty a připojení ke zdroji dat stejně jako z libovolného klienta.

Jako doplněk SQL Serveru je samostatný server také užitečný jako výkonné vývojové prostředí, pokud potřebujete místní i vzdálené výpočty. Balíčky R a Python na samostatném serveru jsou stejné jako balíčky poskytované při instalaci databázového stroje, což umožňuje přepínání kódu a přepínání výpočetních kontextů.

Jak začít

Začněte nastavením, připojte binární soubory k oblíbenému vývojovému nástroji a napište svůj první skript.

Krok 1: Instalace softwaru

Nainstalujte jednu z těchto verzí:

Krok 2: Konfigurace vývojového nástroje

Na samostatném serveru je běžné pracovat místně pomocí vývoje nainstalovaného na stejném počítači.

Krok 3: Napsání prvního skriptu

Napište skript R nebo Python pomocí funkcí z RevoScaleR, revoscalepy a algoritmů strojového učení.

  • Prozkoumejte R a RevoScaleR ve 25 funkcích: Začněte se základními příkazy R a pak přejděte k distribuovatelným analytickým funkcím RevoScaleR, které poskytují vysoký výkon a škálování na řešení R. Zahrnuje paralelizovatelné verze mnoha nejoblíbenějších balíčků modelování R, jako jsou clustering k-means, rozhodovací stromy a rozhodovací doménové struktury a nástroje pro manipulaci s daty.

  • Rychlý start: Příklad binární klasifikace s balíčkem Microsoftml Python: Vytvoření binárního klasifikačního modelu pomocí funkcí z microsoftml a dobře známé datové sady rakoviny prsu.

Zvolte pro úkol nejvhodnější jazyk. Jazyk R je nejvhodnější pro statistické výpočty, které se obtížně implementují pomocí SQL. Pro operace založené na sadě dat použijte výkon SQL Serveru k dosažení maximálního výkonu. Pro velmi rychlé výpočty ve sloupcích použijte databázový stroj v paměti.

Krok 4: Zprovoznění řešení

Samostatné servery mohou využívat funkci operacionalizace serveru Microsoft Machine Learning, který není označen SQL. Můžete nakonfigurovat samostatný server pro operacionalizaci, který poskytuje tyto výhody: nasazení a hostování kódu jako webových služeb, spuštění diagnostiky, testování kapacity webové služby.

Krok 5: Údržba serveru

SQL Server pravidelně vydává kumulativní aktualizace. Použití kumulativních aktualizací přidá do existující instalace vylepšení zabezpečení a funkčnosti.

Popis nových nebo změněných funkcí najdete v článku o staženém souboru CAB a v článcích o verzích sestavení pro SQL Server 2016, SQL Server 2017 a SQL Server 2019.

Další informace o tom, jak použít aktualizace pro existující instanci, naleznete v části Instalace aktualizací v pokynech k instalaci.