Sdílet prostřednictvím


microsoftml (Python package in SQL Server Machine Learning Services)

Platí pro: SQL Server 2017 (14.x) a novější verze

microsoftml je python balíček od Microsoftu, který poskytuje vysoce výkonné algoritmy strojového učení. Zahrnuje funkce pro trénování a transformace, skórování, analýzu textu a obrázků a extrakci rysů pro odvození hodnot z existujících dat. Balíček je součástí SQL Server Machine Learning Services a podporuje vysoký výkon na big data, využívá vícejádrové zpracování a rychlé streamování dat.

Podrobnosti o balíčku Information
Aktuální verze: 9.4
Postaveno na: Anaconda 4.2 distribuce Pythonu 3.7.1
Distribuce balíčků: SQL Server Machine Learning Services verze 2017 nebo 2019.

Jak používat microsoftml

Modul microsoftml je nainstalován jako součást SQL Server Machine Learning Services při přidání Pythonu do vaší instalace. Dostanete kompletní kolekci proprietárních balíčků plus distribuci v Pythonu s jejími moduly a interpretery. Můžete použít jakékoli Python IDE k psaní funkcí volajících Python skripty v MicrosoftML, ale skript musí běžet na počítači s SQL Server Machine Learning Services s Pythonem.

Microsoftml a revoscalepy jsou úzce propojené; Datové zdroje používané v MicrosoftML jsou definovány jako objekty Revoscalepy . Compute context limitations in revoscalepy transfer to microsoftml. Konkrétně je veškerá funkcionalita dostupná pro lokální operace, ale přepnutí na vzdálený výpočetní kontext vyžaduje RxSpark nebo RxInSQLServer.

Verze a platformy

Modul Microsoftml je dostupný pouze při instalaci jednoho z následujících produktů nebo stažení produktů Microsoft:

Poznámka:

Plné verze produktových vydání jsou v SQL Server 2017 dostupné pouze pro Windows. Windows i Linux jsou podporovány pro microsoftml v SQL Server 2019.

Závislosti balíčků

Algoritmy v MicrosoftML závisí na revoscalepy pro:

  • Objekty zdrojů dat – Data spotřebovaná funkcemi microsoftml jsou vytvářena pomocí revoscalepy funkcí.
  • Vzdálené výpočty (přesun výkonu funkcí na vzdálenou instanci SQL Serveru) – Balíček revoscalepy poskytuje funkce pro vytváření a aktivaci vzdáleného výpočetního kontextu pro SQL Server.

Ve většině případů načtete balíčky dohromady, kdykoli používáte microsoftml.

Funkce podle kategorie

Tato sekce uvádí funkce podle kategorií, abyste měli představu, jak se každá z nich používá. Obsah můžete také použít k nalezení funkcí v abecedním pořadí.

1-Tréninkové funkce

Funkce Description
microsoftml.rx_ensemble Vyškolte soubor modelů.
microsoftml.rx_fast_forest Náhodný les.
microsoftml.rx_fast_linear Lineární model. se stochastickým dvojím souřadnicovým vzestupem.
microsoftml.rx_fast_trees Posílené stromy.
microsoftml.rx_logistic_regression Logistická regrese.
microsoftml.rx_neural_network Neuronová síť.
microsoftml.rx_oneclass_svm Detekce anomálií.

2-transformační funkce

Manipulace s kategoriálními proměnnými

Funkce Description
microsoftml.categorical Převádí textový sloupec do kategorií.
microsoftml.categorical_hash Hashuje a převádí textový sloupec do kategorií.

Manipulace se schématy

Funkce Description
microsoftml.concat Spojuje více sloupců do jednoho vektoru.
microsoftml.drop_columns Vyhazuje sloupce z datové sady.
microsoftml.select_columns Zachovává sloupce datové sady.

Výběr proměnné

Funkce Description
microsoftml.count_select Výběr rysů na základě počtu členů.
microsoftml.mutualinformation_select Výběr vlastností na základě vzájemných informací.

Analýza textu

Funkce Description
microsoftml.featurize_text Převádí textové sloupce na číselné prvky.
microsoftml.get_sentiment Analýza sentimentu.

Analýza obrázků

Funkce Description
microsoftml.load_image Načte obraz.
microsoftml.resize_image Změna velikosti obrázku.
microsoftml.extract_pixels Extrahuje pixely z obrázku.
microsoftml.featurize_image Převádí obrázek na funkce.

Funkce featurizace

Funkce Description
microsoftml.rx_featurize Transformace dat pro datové zdroje

Funkce bodování

Funkce Description
microsoftml.rx_predict Skóre využívající model strojového učení Microsoftu

Jak volat Microsoftml

Funkce v microsoftml lze volat v python kódu zapouzdřeném v uložených procedurách. Většina vývojářů vytváří řešení MicrosoftML lokálně a poté migruje hotový Python kód do uložených procedur jako cvičení nasazení.

Balíček microsoftml pro Python je nainstalován ve výchozím nastavení, ale na rozdíl od revoscalepy se ve výchozím nastavení nenačítá při spuštění Python relace pomocí spustitelných souborů Pythonu nainstalovaných přes SQL Server.

Jako první krok importujte balíček MicrosoftML a importujte Revoscalepy , pokud potřebujete použít vzdálené výpočetní kontexty nebo související konektivitu či objekty zdrojů dat. Poté odkazujte na jednotlivé funkce, které potřebujete.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Viz také