Tutorial: Criar um modelo de aprendizagem automática no Power BI

Importante

A criação de modelos do Power BI Automated Machine Learning (AutoML) para fluxos de dados v1 foi desativada e não está mais disponível. Os clientes são incentivados a migrar sua solução para o recurso AutoML no Microsoft Fabric. Para obter mais informações, consulte o anúncio de aposentadoria.

Neste tutorial, você usa o aprendizado de máquina automatizado para criar e aplicar um modelo de previsão binário no Power BI. Você cria um fluxo de dados do Power BI e usa as entidades definidas no fluxo de dados para treinar e validar um modelo de aprendizado de máquina diretamente no Power BI. Em seguida, você usa esse modelo para pontuar novos dados e gerar previsões.

Primeiro, você cria um modelo de aprendizado de máquina de previsão binária para prever a intenção de compra dos compradores on-line, com base em um conjunto de seus atributos de sessão online. Você usa um modelo semântico de aprendizado de máquina de referência para este exercício. Depois de treinar um modelo, o Power BI gera automaticamente um relatório de validação que explica os resultados do modelo. Em seguida, você pode revisar o relatório de validação e aplicar o modelo aos seus dados para pontuação.

Este tutorial consiste nas seguintes etapas:

  • Crie um fluxo de dados com os dados de entrada.
  • Crie e treine um modelo de aprendizado de máquina.
  • Analise o relatório de validação do modelo.
  • Aplique o modelo a uma entidade de fluxo de dados.
  • Use a saída pontuada do modelo em um relatório do Power BI.

Criar um fluxo de dados com os dados de entrada

Crie um fluxo de dados com dados de entrada seguindo estas etapas.

Obter Dados

A primeira etapa na criação de um fluxo de dados é ter suas fontes de dados prontas. Nesse caso, você usa um modelo semântico de aprendizado de máquina a partir de um conjunto de sessões online, algumas das quais culminaram em uma compra. O modelo semântico contém um conjunto de atributos sobre essas sessões, que você usa para treinar seu modelo.

Você pode baixar o modelo semântico no site da UC Irvine ou baixando o online_shoppers_intention.csv. Mais adiante neste tutorial, você se conecta ao modelo semântico especificando sua URL.

Criar as tabelas

Para criar as entidades em seu fluxo de dados, entre no serviço do Power BI e navegue até um espaço de trabalho.

  1. Se você não tiver um espaço de trabalho, crie um selecionando Espaços de trabalho no painel de navegação esquerdo do Power BI e selecionando Criar um espaço de trabalho. No painel Criar um espaço de trabalho, insira um nome de espaço de trabalho e selecione Salvar.

    Captura de ecrã de como criar uma área de trabalho.

  2. Selecione Novo na parte superior do novo espaço de trabalho e, em seguida, selecione Fluxo de dados.

    Captura de tela de como criar um fluxo de dados.

  3. Selecione Adicionar novas tabelas para iniciar um editor do Power Query no browser.

    Captura de ecrã a mostrar a seleção Adicionar novas tabelas.

  4. Na tela Escolher fonte de dados, selecione Texto/CSV como fonte de dados.

    Captura de ecrã a mostrar a seleção de Texto/CSV em Escolher origem de dados.

  5. Na página Conectar a uma fonte de dados, cole o link a seguir para o arquivo online_shoppers_intention.csv na caixa Caminho do arquivo ou URL e selecione Avançar.

    https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

    Captura de tela que mostra a colagem no caminho do arquivo.

  6. O Editor do Power Query mostra uma pré-visualização dos dados do ficheiro CSV. Para fazer alterações nos dados antes de carregá-los, selecione Transformar dados.

    Captura de ecrã a mostrar a seleção de Transformar dados no ecrã Pré-visualizar dados do ficheiro.

  7. O Power Query infere automaticamente os tipos de dados das colunas. Você pode alterar os tipos de dados selecionando o ícone de tipo de atributo na parte superior dos cabeçalhos das colunas. Altere o tipo da coluna Receita para Verdadeiro/Falso.

    Você pode renomear a consulta para um nome mais amigável alterando o valor na caixa Nome no painel direito. Altere o nome da consulta para Visitantes online.

    Captura de ecrã a mostrar a alteração do nome da consulta e do tipo de dados da coluna Receita.

  8. Selecione Salvar e fechar e, na caixa de diálogo, forneça um nome para o fluxo de dados e, em seguida, selecione Salvar.

    Captura de tela mostrando como salvar o fluxo de dados.

Criar e treinar um modelo de aprendizado de máquina

Para adicionar um modelo de aprendizado de máquina:

  1. Selecione o ícone Aplicar modelo de ML na lista Ações da tabela que contém os dados de treinamento e as informações do rótulo e, em seguida, selecione Adicionar um modelo de aprendizado de máquina.

    Captura de tela que mostra a adição de um modelo de aprendizado de máquina.

  2. A primeira etapa para criar seu modelo de aprendizado de máquina é identificar os dados históricos, incluindo o campo de resultado que você deseja prever. O modelo é criado aprendendo com esses dados. Neste caso, você quer prever se os visitantes vão ou não fazer uma compra. O resultado que você deseja prever está no campo Receita . Selecione Receita como o valor da coluna Resultado e, em seguida, selecione Avançar.

    Captura de tela que mostra a seleção de um campo de dados históricos.

  3. Em seguida, selecione o tipo de modelo de aprendizado de máquina a ser criado. O Power BI analisa os valores no campo de resultados que identificou e sugere os tipos de modelos de aprendizagem automática que pode criar para prever esse campo.

    Nesse caso, como você deseja prever um resultado binário de se um visitante vai ou não fazer uma compra, o Power BI recomenda a Previsão Binária. Como você está interessado em prever os visitantes que farão uma compra, selecione true em Escolha um resultado-alvo. Você também pode fornecer rótulos diferentes para usar para os resultados no relatório gerado automaticamente que resume os resultados da validação do modelo. Em seguida, selecione Seguinte.

    Captura de tela que mostra a tela de previsão binária.

  4. O Power BI faz uma verificação preliminar de uma amostra de seus dados e sugere entradas que podem produzir previsões mais precisas. Se o Power BI não recomendar uma coluna, ele explica por que não ao lado da coluna. Você pode alterar as seleções para incluir apenas os campos que deseja que o modelo estude marcando ou desmarcando as caixas de seleção ao lado dos nomes das colunas. Selecione Avançar para aceitar as entradas.

    Captura de tela que mostra as seleções de coluna.

  5. Na etapa final, nomeie o modelo como Previsão de intenção de compra e escolha a quantidade de tempo a ser gasto em treinamento. Você pode reduzir o tempo de treinamento para ver resultados rápidos ou aumentar o tempo para obter o melhor modelo. Em seguida, selecione Salvar e treinar para começar a treinar o modelo.

    Captura de tela que mostra nomeando o modelo e escolhendo o tempo de treinamento.

Se você receber um erro semelhante a Credenciais não encontradas para a fonte de dados, precisará atualizar suas credenciais para que o Power BI possa pontuar os dados. Para atualizar suas credenciais, selecione Mais opções ... na barra de cabeçalho e, em seguida, selecione> Configurações de configurações.

Captura de ecrã que mostra a seleção de Definições.

Selecione seu fluxo de dados em Fluxos de dados, expanda Credenciais da fonte de dados e selecione Editar credenciais.

Captura de tela que mostra a edição de credenciais de fluxo de dados.

Acompanhe o status do treinamento

O processo de treinamento começa com a amostragem e normalização de seus dados históricos e a divisão do modelo semântico em duas novas entidades: Dados de Treinamento de Previsão de Intenção de Compra e Dados de Teste de Previsão de Intenção de Compra.

Dependendo do tamanho do modelo semântico, o processo de treinamento pode levar de alguns minutos até o tempo de treinamento selecionado. Você pode confirmar que o modelo está sendo treinado e validado por meio do status do fluxo de dados. O status aparece como uma atualização de dados em andamento na guia Modelos semânticos + fluxos de dados do espaço de trabalho.

Captura de tela que mostra o modelo em treinamento.

Você pode ver o modelo na guia Modelos de aprendizado de máquina do fluxo de dados. Status indica se o modelo foi enfileirado para treinamento, está em treinamento ou está treinado. Quando o treinamento do modelo for concluído, o fluxo de dados exibirá um Último tempo treinado atualizado e um status de Treinado.

Captura de tela que mostra o status Treinada e a Última hora treinada.

Rever o relatório de validação do modelo

Para revisar o relatório de validação do modelo, na guia Modelos de aprendizado de máquina, selecione o ícone Exibir relatório de treinamento em Ações. Este relatório descreve o desempenho provável do seu modelo de aprendizado de máquina.

Na página Desempenho do Modelo do relatório, selecione Ver principais preditores para visualizar os principais preditores do seu modelo. Você pode selecionar um dos preditores para ver como a distribuição de resultados está associada a esse preditor.

Captura de tela que mostra a página Desempenho do modelo.

Você pode usar a segmentação de dados Limiar de probabilidade na página Desempenho do modelo para examinar a influência da precisão e recuperação do modelo no modelo.

Captura de tela que mostra a segmentação de dados Limiar de Probabilidade.

As outras páginas do relatório descrevem as métricas de desempenho estatístico para o modelo.

O relatório também inclui uma página Detalhes de treinamento que descreve a execução de iterações, como os recursos foram extraídos das entradas e os hiperparâmetros para o modelo final usado.

Aplicar o modelo a uma entidade de fluxo de dados

Selecione o botão Aplicar modelo na parte superior do relatório para invocar este modelo. Na caixa de diálogo Aplicar, você pode especificar a entidade de destino que possui os dados de origem aos quais aplicar o modelo. Em seguida, selecione Salvar e aplicar.

Captura de tela que mostra a aplicação do modelo.

A aplicação do modelo cria duas novas tabelas, com os sufixos enriquecidos <model_name> e enriquecidos <model_name> explicações. Neste caso, a aplicação do modelo à tabela de visitantes online cria:

  • Os visitantes on-line enriqueceram a previsão de intenção de compra, que inclui a saída prevista do modelo.
  • Os visitantes on-line enriqueceram as explicações de previsão de intenção de compra, que contém os principais influenciadores específicos do registro para a previsão.

A aplicação do modelo de previsão binário adiciona quatro colunas: Outcome, PredictionScore, PredictionExplanation e ExplanationIndex, cada uma com um prefixo de previsão de intenção de compra.

Captura de ecrã que mostra as quatro novas colunas.

Quando a atualização do fluxo de dados for concluída, você poderá selecionar a tabela de previsão de intenção de compra enriquecida para visitantes on-line para exibir os resultados.

Captura de ecrã que mostra a visualização dos resultados na tabela de previsão de intenção de compra enriquecida dos visitantes online.

Também pode invocar qualquer modelo de aprendizagem automática na área de trabalho diretamente a partir do Editor do Power Query no seu fluxo de dados. Para acessar os modelos de aprendizado de máquina automatizados, selecione Editar para a tabela que você deseja enriquecer com informações do seu modelo de aprendizado de máquina automatizado.

Captura de tela que mostra a seleção Editar para a tabela.

No Editor do Power Query, selecione AI insights na faixa de opções.

Captura de tela que mostra a seleção de insights de IA.

Na tela AI insights, selecione a pasta Modelos de Aprendizado de Máquina do Power BI no painel de navegação. A lista mostra todos os modelos de aprendizagem automática a que tem acesso como funções do Power Query. Os parâmetros de entrada para o modelo de aprendizagem automática são mapeados automaticamente como parâmetros da função Power Query correspondente. O mapeamento automático de parâmetros acontece somente se os nomes e tipos de dados do parâmetro forem os mesmos.

Para invocar um modelo de aprendizado de máquina, você pode selecionar qualquer uma das colunas do modelo selecionado como uma entrada na lista suspensa. Você também pode especificar um valor constante para usar como entrada alternando o ícone de coluna ao lado da linha de entrada.

Captura de ecrã que mostra o browser de funções do Power Query.

Selecione Aplicar para visualizar a visualização da saída do modelo de aprendizado de máquina como novas colunas na tabela. Você também vê a invocação do modelo em Etapas aplicadas para a consulta.

Captura de ecrã que mostra os resultados da visualização no Power Query Editor.

Depois de salvar o fluxo de dados, o modelo invoca automaticamente quando o fluxo de dados é atualizado para quaisquer linhas novas ou atualizadas na tabela de entidades.

Usando a saída pontuada do modelo em um relatório do Power BI

Para usar a saída pontuada do seu modelo de aprendizado de máquina, você pode se conectar ao seu fluxo de dados do Power BI Desktop usando o conector Dataflows . Agora você pode usar a tabela de previsão de intenção de compra enriquecida para visitantes online para incorporar as previsões do seu modelo nos relatórios do Power BI.

Limitações

Existem alguns problemas conhecidos com o uso de gateways com aprendizado de máquina automatizado. Se você precisar usar um gateway, é melhor criar um fluxo de dados que importe os dados necessários por meio do gateway primeiro. Em seguida, crie outro fluxo de dados que faça referência ao primeiro fluxo de dados para criar ou aplicar esses modelos.

Se o seu trabalho de IA com fluxos de dados falhar, talvez seja necessário ativar o Fast Combine ao usar IA com fluxos de dados. Depois de importar sua tabela e antes de começar a adicionar recursos de IA, selecione Opções na faixa de opções Página Inicial e, na janela exibida, marque a caixa de seleção ao lado de Permitir a combinação de dados de várias fontes para habilitar o recurso e, em seguida, selecione OK para salvar sua seleção. Em seguida, você pode adicionar recursos de IA ao seu fluxo de dados.

Neste tutorial, você criou e aplicou um modelo de previsão binário no Power BI seguindo estas etapas:

  • Criado um fluxo de dados com os dados de entrada.
  • Criei e treinei um modelo de machine learning.
  • Revisado o relatório de validação do modelo.
  • Aplicou o modelo a uma entidade de fluxo de dados.
  • Aprendeu como usar a saída pontuada do modelo em um relatório do Power BI.

Para obter mais informações sobre a automação do Aprendizado de Máquina no Power BI, consulte Aprendizado de máquina automatizado no Power BI.