Partilhar via


O que é AutoML?

O Databricks AutoML ajuda você a aplicar automaticamente o aprendizado de máquina a um conjunto de dados. Você fornece o conjunto de dados e identifica o destino de previsão, enquanto o AutoML prepara o conjunto de dados para o treinamento do modelo. Em seguida, o AutoML executa e registra um conjunto de avaliações que cria, ajusta e avalia vários modelos. Após a avaliação do modelo, o AutoML exibe os resultados e fornece um bloco de anotações Python com o código-fonte de cada execução de avaliação para que você possa revisar, reproduzir e modificar o código. O AutoML também calcula estatísticas resumidas em seu conjunto de dados e salva essas informações em um bloco de anotações que você pode revisar mais tarde.

Você pode usar o Databricks AutoML para problemas de regressão, classificação e previsão. Saiba mais sobre como funciona o Azure Databricks AutoML.

Requerimentos

  • Databricks Runtime 9.1 ML ou superior. Para a versão de disponibilidade geral (GA), Databricks Runtime 10.4 LTS ML ou superior.
    • Para previsão de séries temporais, Databricks Runtime 10.0 ML ou superior.
    • Com o Databricks Runtime 9.1 LTS ML e superior, o AutoML depende do databricks-automl-runtime pacote, que contém componentes que são úteis fora do AutoML e também ajuda a simplificar os notebooks gerados pelo treinamento AutoML. databricks-automl-runtimeestá disponível no PyPI.
  • Nenhuma biblioteca adicional além daquelas pré-instaladas no Databricks Runtime for Machine Learning deve ser instalada no cluster.
    • Qualquer modificação (remoção, upgrades ou downgrades) em versões de bibliotecas existentes resulta em falhas de execução devido a incompatibilidade.
  • O AutoML não é compatível com clusters de modo de acesso compartilhado.
  • Para usar o Unity Catalog com AutoML, o modo de acesso ao cluster deve ser Usuário Único e você deve ser o usuário único designado do cluster.

Habilitar o AutoML para acessar arquivos de espaço de trabalho

O AutoML usa o sistema de arquivos do espaço de trabalho para acessar conjuntos de dados durante a execução de experimentos. Você deve ter as portas de rede 1017 e 1021 abertas para experimentos AutoML para acessar arquivos em seu espaço de trabalho.

Para abrir essas portas ou confirmar que estão abertas, revise a configuração do firewall da VPN na nuvem e as regras do grupo de segurança ou entre em contato com o administrador da nuvem local. Para obter informações adicionais sobre configuração e implantação de espaços de trabalho, consulte Criar um espaço de trabalho.

Próximos passos