Usar o scikit-learn no Azure Databricks

Esta página fornece exemplos de como você pode usar o pacote scikit-learn para treinar modelos de machine learning no Azure Databricks. O scikit-learn é uma das bibliotecas Python mais populares para machine learning de nó único e está incluída no Databricks Runtime e no Databricks Runtime ML. Consulte as Notas sobre a versão do Databricks Runtime para a versão da biblioteca Scikit-learn incluída no runtime do cluster.

Você pode importar esses notebooks e executá-los no workspace do Azure Databricks.

Para obter mais notebooks de exemplo para introdução rápida no Azure Databricks, consulte Tutoriais: introdução ao ML.

Exemplo básico usando o scikit-learn

Este notebook fornece uma visão geral rápida do treinamento do modelo de machine learning no Azure Databricks. Ele usa o pacote scikit-learn para treinar um modelo de classificação simples. Ele também ilustra o uso de MLflow para acompanhar o processo de desenvolvimento do modelo e Hyperopt para automatizar o ajuste do hiperparâmetro.

Notebook de classificação do scikit-learn

Obter notebook

Exemplo de ponta a ponta usando scikit-learn no Azure Databricks

Este notebook usa o scikit-learn para ilustrar um exemplo ponta a ponta de carregamento de dados, treinamento de modelo, ajuste de hiperparâmetro distribuído e inferência de modelo. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando o Registro de Modelo do MLflow para registrar o modelo.

Usar o scikit-learn com o notebook de integração do MLflow

Obter notebook