Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
Esse recurso está em Visualização Pública.
Este artigo mostra como executar um experimento de previsão sem servidor usando a interface de usuário do Treinamento de Modelos do Databricks.
Treinamento de modelo do Databricks – a previsão simplifica a previsão de dados de série temporal selecionando automaticamente o melhor algoritmo e hiperparâmetros, tudo isso durante a execução em recursos de computação totalmente gerenciados.
Para entender a diferença entre a previsão sem servidor e a previsão de computação clássica, consulte previsão sem servidor versus previsão de computação clássica.
Requisitos
- Dados de treinamento com uma coluna de série temporal, salva como uma tabela do Unity Catalog.
- Se o workspace tiver o controle de saída sem servidor habilitado,
pypi.orgdeverá ser adicionado à lista de domínios permitidos . Consulte Gerenciar políticas de rede para controle de saída sem servidor.
Criar um experimento de previsão com a interface do usuário
Vá para a página inicial do Azure Databricks e clique em Experimentos na barra lateral.
No bloco Previsão , selecione Iniciar treinamento.
Selecione os dados de treinamento em uma lista de tabelas do Catálogo do Unity que você pode acessar.
-
Coluna de tempo: selecione a coluna que contém os períodos de tempo da série temporal. As colunas devem ser do tipo
timestampoudate. - Frequência de previsão: selecione a unidade de tempo que representa a frequência dos dados de entrada. Por exemplo, minutos, horas, dias, meses. Isso determina a granularidade de sua série temporal.
- Horizonte de previsão: especifique quantas unidades da frequência selecionada devem ser previstas para o futuro. Junto com a frequência de previsão, isso define as unidades de tempo e o número de unidades de tempo a serem previstas.
Observação
Para usar o algoritmo AUTO-ARIMA , a série temporal deve ter uma frequência regular em que o intervalo entre dois pontos deve ser o mesmo ao longo da série temporal. O AutoML manipula as etapas de tempo ausentes preenchendo esses valores com o valor anterior.
-
Coluna de tempo: selecione a coluna que contém os períodos de tempo da série temporal. As colunas devem ser do tipo
Selecione uma coluna alvo de previsão que você deseja que o modelo preveja.
Especifique, opcionalmente, um caminho de dados de previsão na tabela do Catálogo do Unity para armazenar as previsões de saída.
Selecione um local e um nome de registro de modelo do Catálogo do Unity.
Opcionalmente, defina opções avançadas:
- Nome do experimento: forneça um nome de experimento do MLflow.
- Colunas do identificador de série temporal – para previsão de várias séries, selecione as colunas que identificam a série temporal individual. O Databricks agrupa os dados por essas colunas como séries temporais diferentes e treina um modelo para cada série de forma independente.
- Métrica primária: escolha a métrica primária usada para avaliar e selecionar o melhor modelo.
- Estrutura de treinamento: escolha as estruturas para o AutoML explorar.
- Dividir coluna: selecione a coluna que contém a divisão de dados personalizada. Os valores devem ser "treinar", "validar", "testar"
- Coluna de peso: especifique a coluna a ser usada para a ponderação de séries temporais. Todos os exemplos de uma determinada série temporal devem ter o mesmo peso. O peso deve estar no intervalo [0, 10000].
- Região de férias: selecione a região de férias a ser usada como covariada no treinamento de modelo.
- Tempo limite: defina uma duração máxima para o experimento AutoML.
Execute o experimento e monitore os resultados
Para iniciar o experimento autoML, clique em Iniciar o treinamento. Na página de treinamento do experimento, você pode fazer o seguinte:
- Pare o experimento a qualquer momento.
- Monitorar execuções.
- Navegue até a página de execução para qualquer execução.
Além disso, você pode verificar o status do experimento conforme ele passa pelos seguintes estágios:
- Pré-processamento: Valide e prepare a tabela de entrada imputando valores ausentes e dividindo dados em conjuntos de treinamento, validação e teste. O processamento automático de geração de características, como a codificação binária para características categóricas, também é realizada durante esse estágio.
- Ajuste: Explore diferentes algoritmos de previsão e ajuste os hiperparâmetros.
- Formação: Treine e avalie o modelo final com as melhores configurações selecionadas. Registre o modelo no Catálogo do Unity se um caminho for especificado.
Exibir resultados ou usar o melhor modelo
Após a conclusão do treinamento, os resultados da previsão são armazenados na tabela Delta especificada e o melhor modelo é registrado no Catálogo do Unity.
Na página de experimentos, você escolhe entre as seguintes etapas:
- Selecione Exibir previsões para ver a tabela de resultados de previsão.
- Selecione o notebook de inferência em lote para abrir um notebook automaticamente gerado para inferência em lote usando o melhor modelo.
- Selecione Criar ponto de serviço para implantar o melhor modelo em um ponto de serviço de Model Serving.
Previsão sem servidor versus previsão de computação clássica
A tabela a seguir resume as diferenças entre previsão sem servidor e previsão com computação clássica
| Característica | Previsão sem servidor | Previsão de computação clássica |
|---|---|---|
| Infraestrutura de computação | O Azure Databricks gerencia a configuração de computação e otimiza automaticamente o custo e o desempenho. | Computação configurada pelo usuário |
| Governança | Modelos e artefatos registrados no Catálogo do Unity | Repositório de arquivos de workspace configurado pelo usuário |
| Escolha do algoritmo | Modelos estatísticos mais o algoritmo de rede neural de aprendizado profundo DeepAR | Modelos estatísticos |
| Integração do Feature Store | Sem suporte | Suportado |
| Notebooks gerados automaticamente | Caderno de inferência em lote | Código-fonte para todas as avaliações |
| Implantação de serviço de modelo de um clique | Suportado | Sem suporte |
| Divisões de treinamento/validação/teste personalizadas | Suportado | Sem suporte |
| Pesos personalizados para séries temporais individuais | Suportado | Sem suporte |