O que é AutoML?
O AutoML do Databricks ajuda você a aplicar automaticamente o aprendizado de máquina a um conjunto de informações. Você fornece o conjunto de dados e identifica o destino da previsão, enquanto o AutoML prepara o conjunto de dados para treinamento do modelo. O AutoML executa e registra um conjunto de avaliações que cria, ajusta e avalia vários modelos. Após a avaliação de modelo, o AutoML exibe os resultados e fornece um notebook do Python com o código-fonte para cada execução de avaliação para que você possa examinar, reproduzir e modificar o código. O AutoML também calcula estatísticas resumidas do conjunto de dados e salva essas informações em um notebook que você pode examinar mais tarde.
Você pode usar o AutoML do Databricks para problemas de regressão, classificação e previsão. Saiba mais sobre Como funciona o AutoML do Azure Databricks.
Requisitos
- Databricks Runtime 9.1 ML ou superior. Para a versão de GA (disponibilidade geral), o Databricks Runtime 10.4 LTS ML ou superior.
- Para previsão de série temporal, Databricks Runtime 10.0 ML ou superior.
- Com o Databricks Runtime 9.1 LTS ML e superior, o AutoML depende do pacote
databricks-automl-runtime
, que contém os componentes que são úteis fora do AutoML e também ajuda a simplificar os blocos de anotações gerados pelo treinamento do AutoML.databricks-automl-runtime
está disponível em PyPI.
- Nenhuma biblioteca adicional, além daquelas instaladas previamente no Databricks Runtime for Machine Learning, deve ser instalada no cluster.
- Qualquer modificação (remoção, atualizações ou realização de downgrade) para as versões de bibliotecas existentes resulta em falhas de execução devido à incompatibilidade.
- O AutoML não é compatível com clusters de modo de acesso compartilhado.
- Para usar o Catálogo do Unity com AutoML, o modo de acesso ao cluster deve ser Usuário único, e você deve ser o único usuário do cluster.