Registro automático no Microsoft Fabric
O Synapse Data Science no Microsoft Fabric inclui registro automático, que reduz significativamente a quantidade de código necessária para registrar automaticamente os parâmetros, métricas e itens de um modelo de aprendizado de máquina durante o treinamento. Este artigo descreve o registro automático para Synapse Data Science no Microsoft Fabric.
O registro automático amplia os recursos do MLflow Tracking e está profundamente integrado à experiência Synapse Data Science no Microsoft Fabric. O registro automático pode capturar várias métricas, incluindo precisão, perda, pontuação F1 e métricas personalizadas definidas por você. Usando o registro automático, desenvolvedores e cientistas de dados podem facilmente rastrear e comparar o desempenho de diferentes modelos e experimentos sem rastreamento manual.
Estruturas suportadas
O registro automático suporta uma ampla gama de estruturas de aprendizado de máquina, incluindo TensorFlow, PyTorch, Scikit-learn e XGBoost. Para saber mais sobre as propriedades específicas da estrutura que o registro automático captura, consulte a documentação do MLflow.
Configuração
O registro automático funciona capturando automaticamente valores de parâmetros de entrada, métricas de saída e itens de saída de um modelo de aprendizado de máquina enquanto ele está sendo treinado. Essas informações são registradas em seu espaço de trabalho do Microsoft Fabric, onde você pode acessá-las e visualizá-las usando as APIs MLflow ou os itens de experimento e modelo correspondentes em seu espaço de trabalho do Microsoft Fabric.
Quando você inicia um bloco de anotações Synapse Data Science, o Microsoft Fabric chama mlflow.autolog() para habilitar instantaneamente o rastreamento e carregar as dependências correspondentes. À medida que você treina modelos em seu notebook, o MLflow rastreia automaticamente essas informações do modelo.
A configuração acontece automaticamente nos bastidores quando você executa import mlflow
o . A configuração padrão para o gancho mlflow.autolog() do notebook é:
mlflow.autolog(
log_input_examples=False,
log_model_signatures=True,
log_models=True,
disable=False,
exclusive=True,
disable_for_unsupported_versions=True,
silent=True
)
Personalização
Para personalizar o comportamento de log, você pode usar a configuração mlflow.autolog(). Essa configuração fornece parâmetros para habilitar o registro em log do modelo, coletar amostras de entrada, configurar avisos ou habilitar o registro em log para conteúdo adicionado que você especificar.
Acompanhe mais métricas, parâmetros e propriedades
Para execuções criadas com MLflow, atualize a configuração de registro automático MLflow para rastrear métricas, parâmetros, arquivos e metadados adicionais da seguinte maneira:
Atualize a chamada mlflow.autolog() para definir
exclusive=False
.mlflow.autolog( log_input_examples=False, log_model_signatures=True, log_models=True, disable=False, exclusive=False, # Update this property to enable custom logging disable_for_unsupported_versions=True, silent=True )
Use as APIs de rastreamento MLflow para registrar parâmetros e métricas adicionais. O código de exemplo a seguir permite que você registre suas métricas e parâmetros personalizados juntamente com propriedades adicionais.
import mlflow mlflow.autolog(exclusive=False) with mlflow.start_run(): mlflow.log_param("parameter name", "example value") # <add model training code here> mlflow.log_metric("metric name", 20)
Desabilitar o registro automático do Microsoft Fabric
Você pode desabilitar o registro automático do Microsoft Fabric para uma sessão de bloco de anotações específica. Você também pode desabilitar o registro automático em todos os blocos de anotações usando a configuração do espaço de trabalho.
Nota
Se o registro automático estiver desabilitado, você deverá registrar manualmente seus parâmetros e métricas usando as APIs MLflow.
Desativar o registo automático para uma sessão de bloco de notas
Para desabilitar o registro automático do Microsoft Fabric para uma sessão de bloco de anotações específica, chame mlflow.autolog() e defina disable=True
.
import mlflow
mlflow.autolog(disable=True)
Desativar o registo automático para todos os blocos de notas e sessões
Os administradores de espaço de trabalho podem habilitar ou desabilitar o registro automático do Microsoft Fabric para todos os blocos de anotações e sessões em seu espaço de trabalho usando as configurações do espaço de trabalho. Para ativar ou desativar o registro automático do Synapse Data Science:
No espaço de trabalho Synapse Data Science, selecione Configurações do espaço de trabalho.
Na tela Configurações do espaço de trabalho , expanda Engenharia de Dados/Ciência na barra de navegação esquerda e selecione Configurações do Spark.
Na tela Configurações do Spark , selecione a guia Log automático.
Defina Rastrear automaticamente experimentos e modelos de aprendizado de máquina como Ativado ou Desativado.
Selecione Guardar.