Använda Apache Spark MLlib på Azure Databricks

Den här sidan innehåller exempel på notebook-filer som visar hur du använder MLlib på Azure Databricks.

Apache Spark MLlib är Apache Spark-maskininlärningsbiblioteket som består av vanliga inlärningsalgoritmer och verktyg, inklusive klassificering, regression, klustring, samarbetsfilter, dimensionsminskning samt underliggande optimeringsprimitiver. För referensinformation om MLlib-funktioner rekommenderar Azure Databricks följande Apache Spark API-referenser:

Paketet pyspark.ml från Apache Spark MLlib stöds på serverlös, standardbaserad och dedikerad beräkning.

Information om hur du använder Apache Spark MLlib från R finns i dokumentationen för R-maskininlärning .

Exempel på binär klassificering – anteckningsbok

Den här notebook-filen visar hur du skapar ett program för binär klassificering med hjälp av API:et för Apache Spark MLlib-pipelines.

Notebook-fil för binär klassificering

Hämta anteckningsbok

Exempelanteckningsböcker för beslutsträd

De här exemplen visar olika användningsområden för beslutsträd med hjälp av API:et för Apache Spark MLlib-pipelines.

Beslutsträd

Dessa notebook-filer visar hur du utför klassificeringar med beslutsträd.

Beslutsträd för notebook-fil för sifferigenkänning

Hämta anteckningsbok

Beslutsträd för SFO-undersökningens digitala anteckningsbok

Hämta anteckningsbok

GBT-regression med MLlib-pipelines

Den här notebook-filen visar hur du använder MLlib-pipelines för att utföra en regression med förbättrade träd för att förutsäga antalet cykeluthyrningar (per timme) utifrån information som veckodag, väder, säsong och så vidare.

Regressionsnotebook för cykeldelning

Hämta anteckningsbok

Exempel på avancerad Apache Spark MLlib-notebook-fil

Den här notebook-filen visar hur du skapar en anpassad transformator.

Anpassad transformer-anteckningsbok

Hämta anteckningsbok