Introdução

Concluído

Como cientista de dados, você passa a maior parte do tempo treinando modelos de machine learning para identificar padrões complexos em seus dados. Após o treinamento, você deseja usar os modelos para recuperar insights valiosos.

Por exemplo, depois de treinar um modelo sobre dados históricos de vendas, você pode gerar a previsão da próxima semana. Ou, usando dados do cliente, você treina um modelo para identificar clientes que provavelmente irão desistir. Seja qual for o caso de uso que você tiver, depois de treinar o modelo, você deseja aplicar o modelo a um novo conjunto de dados para gerar previsões.

O Microsoft Fabric ajuda você a aplicar seu modelo depois de rastreá-lo com o MLflow.

Entender o processo de ciência de dados

Um projeto de ciência de dados geralmente inclui as seguintes fases:

Diagrama de etapas sequenciais no processo de ciência de dados.

  1. Defina o problema: juntamente com usuários e analistas de negócios, decida sobre o que o modelo deve prever e quando for bem-sucedido.
  2. Obtenha os dados: localize fontes de dados e obtenha acesso armazenando seus dados em um lakehouse.
  3. Prepare os dados: Explore os dados lendo-os de um lakehouse em um notebook. Limpe e transforme os dados com base nos requisitos do modelo.
  4. Treine o modelo: escolha um algoritmo e valores de hiperparâmetro com base na avaliação e no erro, acompanhando seus experimentos com o MLflow.
  5. Gerar previsões: use a pontuação em lote do modelo para gerar as previsões solicitadas.

Neste módulo, você se concentra em como gerar previsões em lotes. Para recuperar previsões de um modelo treinado, primeiro você precisa salvar o modelo no workspace do Microsoft Fabric. Em seguida, você pode preparar seus novos dados e aplicar o modelo aos dados para gerar previsões em lotes. Por fim, você pode salvar as previsões no Microsoft Fabric para processamento adicional, como visualizar os dados em um relatório do Power BI.