O que é AutoML?

O AutoML do Databricks ajuda você a aplicar automaticamente o aprendizado de máquina a um conjunto de informações. Você fornece o conjunto de dados e identifica o destino da previsão, enquanto o AutoML prepara o conjunto de dados para treinamento do modelo. O AutoML executa e registra um conjunto de avaliações que cria, ajusta e avalia vários modelos. Após a avaliação de modelo, o AutoML exibe os resultados e fornece um notebook do Python com o código-fonte para cada execução de avaliação para que você possa examinar, reproduzir e modificar o código. O AutoML também calcula estatísticas resumidas do conjunto de dados e salva essas informações em um notebook que você pode examinar mais tarde.

Você pode usar o AutoML do Databricks para problemas de regressão, classificação e previsão. Saiba mais sobre Como funciona o AutoML do Azure Databricks.

Requisitos

  • Databricks Runtime 9.1 ML ou superior. Para a versão de GA (disponibilidade geral), o Databricks Runtime 10.4 LTS ML ou superior.
    • Para previsão de série temporal, Databricks Runtime 10.0 ML ou superior.
    • Com o Databricks Runtime 9.1 LTS ML e superior, o AutoML depende do pacote databricks-automl-runtime, que contém os componentes que são úteis fora do AutoML e também ajuda a simplificar os blocos de anotações gerados pelo treinamento do AutoML. databricks-automl-runtime está disponível em PyPI.
  • Nenhuma biblioteca adicional, além daquelas instaladas previamente no Databricks Runtime for Machine Learning, deve ser instalada no cluster.
    • Qualquer modificação (remoção, atualizações ou realização de downgrade) para as versões de bibliotecas existentes resulta em falhas de execução devido à incompatibilidade.
  • O AutoML não é compatível com clusters de modo de acesso compartilhado.
  • Para usar o Catálogo do Unity com AutoML, o modo de acesso ao cluster deve ser Usuário único, e você deve ser o único usuário do cluster.

Próximas etapas