Compartilhar via


Usar o MLlib do Apache Spark no Azure Databricks

Esta página apresenta exemplos de notebooks mostrando como usar a MLlib no Azure Databricks.

Apache Spark MLib é a biblioteca de machine learning escalável do Spark que consiste em algoritmos e utilitários de aprendizado comuns, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade, bem como primitivos de otimização subjacente. Para obter informações de referência sobre os recursos da MLlib, o Azure Databricks recomenda a seguinte referência de API do Apache Spark:

Para obter informações sobre como usar a MLlib do Apache Spark no R, confira a documentação de machine learning do R.

Exemplo de notebook de classificação binária

Este notebook mostra como criar um aplicativo de classificação binária usando a API de Pipelines do Apache Spark MLlib.

Notebook de classificação binária

Obter notebook

Exemplos de notebooks de árvores de decisão

Estes exemplos demonstram vários aplicativos de árvores de decisão usando a API de Pipelines do Apache Spark MLlib.

Árvores de decisão

Estes notebooks mostram como executar classificações com árvores de decisão.

Notebook de árvores de decisão para o reconhecimento de dígitos

Obter notebook

Notebook de árvores de decisão para pesquisa SFO

Obter notebook

Regressão de GBT usando pipelines do MLlib

Este notebook mostra como usar pipelines do MLlib para executar uma regressão usando árvores com gradiente aumentado para prever contagens de aluguel de bicicletas (por hora) com base em informações como dia da semana, clima, temporada e assim por diante.

Notebook de regressão de compartilhamento de bicicleta

Obter notebook

Exemplo avançado de notebook da MLlib do Apache Spark

Este notebook ilustra como criar um transformador personalizado.

Notebook de transformador personalizado

Obter notebook