Partilhar via


Usar Python no Power Query Editor

Pode usar Python, uma linguagem de programação amplamente utilizada por estatísticos, cientistas de dados e analistas de dados, no Power BI Desktop Power Query Editor. Esta integração de Python no Power Query Editor permite-lhe realizar limpeza de dados usando Python e realizar modelagem avançada de dados e análises em conjuntos de dados, incluindo a conclusão de dados em falta, previsões e clustering, só para citar alguns. Python é uma linguagem poderosa e pode ser usada no Power Query Editor para preparar o seu modelo de dados e criar relatórios.

Pré-requisitos

Vais precisar de instalar Python e pandas antes de começares.

  • Instalar Python - Para usar Python no Power Query Editor do Power BI Desktop, precisa de instalar Python na sua máquina local. Pode descarregar e instalar Python gratuitamente a partir de muitos locais, incluindo a página oficial de download do Python e o Anaconda.

  • Instalar pandas - Para usar Python com o Power Query Editor, também terá de instalar pandas. O Pandas é usado para mover dados entre o Power BI e o ambiente Python.

Use Python com o Power Query Editor

Para mostrar como usar Python no Power Query Editor, pegue neste exemplo de um conjunto de dados do mercado de ações, baseado num ficheiro CSV que pode descarregar daqui e acompanhar. Os passos para este exemplo são os seguintes procedimentos:

  1. Primeiro, carregue os seus dados no Power BI Desktop. Neste exemplo, carregue o ficheiro EuStockMarkets_NA.csv e selecione Obter dados>Texto/CSV na fita Página Inicial no Power BI Desktop.

    Captura de ecrã da barra de ferramentas Obter Dados no Power BI Desktop, mostrando a seleção CSV.

  2. Selecione o ficheiro e selecione Abrir, e o CSV é exibido no diálogo do ficheiro CSV .

    Captura de ecrã do diálogo do ficheiro CSV, mostrando o CSV selecionado.

  3. Depois de os dados estarem carregados, vê-los no painel de Campos no Power BI Desktop.

    Captura de ecrã do painel de Campos, mostrando os dados carregados.

  4. Abra o Power Query Editor selecionando Transformar dados a partir do separador Home no Power BI Desktop.

    Captura de ecrã do Power Query Editor no Power BI Desktop, mostrando a seleção de dados Transform.

  5. No separador Transformar , selecione Executar Script Python e o editor Run Python Script aparece conforme mostrado no passo seguinte. As linhas 15 e 20 sofrem de dados em falta, tal como outras linhas que não consegues ver na imagem seguinte. Os passos seguintes mostram como o Python completa essas linhas por si.

    Captura de ecrã do separador Transformar, mostrando linhas de dados.

  6. Para este exemplo, introduza o seguinte código de script:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Observação

    Precisas de ter a biblioteca pandas instalada no teu ambiente Python para que o código do script anterior funcione corretamente. Para instalar o pandas, execute o seguinte comando na sua instalação em Python: pip install pandas

    Quando inserido no diálogo Executar Script Python , o código assemelha-se ao seguinte exemplo:

    Captura de ecrã do diálogo Executar Script Python, mostrando o código do script.

  7. Depois de selecionar OK,o Power Query Editor apresenta um aviso sobre privacidade de dados.

    Captura de ecrã do painel do Power Query Editor, mostrando o aviso sobre privacidade de dados.

  8. Para que os scripts Python funcionem corretamente no serviço Power BI, todas as fontes de dados têm de estar definidas como públicas. Para mais informações sobre definições de privacidade e as suas implicações, consulte Níveis de Privacidade.

    Captura de ecrã do diálogo de níveis de privacidade, mostrando que o Público está definido.

    Repare numa nova coluna no painel Campos chamada CompletedValues. Note que faltam alguns elementos de dados, como nas linhas 15 e 18. Vê como o Python lida com isso na próxima secção.

Com apenas três linhas de script Python, o Power Query Editor preencheu os valores em falta com um modelo preditivo.

Criar visuais a partir de dados de scripts Python

Agora podemos criar um visual para ver como o código de script Python usando a biblioteca pandas completou os valores em falta, como mostrado na imagem seguinte:

Captura de ecrã do visual mostrando os dados originais e os valores em falta preenchidos da biblioteca pandas.

Quando esse visual estiver completo, e quaisquer outros visuais que queiras criar usando o Power BI Desktop, podes guardar o ficheiro do Power BI Desktop . Os ficheiros Power BI Desktop guardam-se com a extensão de ficheiro .pbix. Depois usa o modelo de dados, incluindo os scripts Python que fazem parte dele, no serviço Power BI.

Observação

Quer ver um ficheiro .pbix completo com estes passos concluídos? Estás com sorte. Pode descarregar aqui o ficheiro completo do Power BI Desktop usado nestes exemplos.

Depois de carregar o ficheiro .pbix para o serviço Power BI, são necessários mais alguns passos para permitir que os dados sejam atualizados no serviço e para que os visuais sejam atualizados no serviço. Os dados precisam de acesso a Python para que os visuais sejam atualizados. Os outros passos são os seguintes:

  • Ative a atualização agendada para o conjunto de dados. Para permitir a atualização agendada do livro de trabalho que contém o seu conjunto de dados com scripts Python, consulte Configurar a atualização agendada, que também inclui informações sobre o Personal Gateway.
  • Instala o Gateway Pessoal. Precisas de um Personal Gateway instalado na máquina onde o ficheiro está localizado e onde o Python está instalado. O serviço Power BI tem de aceder a esse livro de trabalho e voltar a renderizar quaisquer visualizações atualizadas. Para mais informações, consulte instalar e configurar o Personal Gateway.

Considerações e limitações

Existem algumas limitações para consultas que incluem scripts Python criados no Power Query Editor:

  • Todas as definições de fontes de dados em Python devem estar definidas como Público, e todos os outros passos numa consulta criada no Power Query Editor também devem ser públicos. Para aceder às definições da fonte de dados, no Power BI Desktop selecione Opções de Ficheiro > e definições > Definições da fonte de dados.

    Captura de ecrã do menu Ficheiro no Power BI Desktop, mostrando a seleção das definições da fonte de dados.

    No diálogo de Definições de Fonte de Dados , selecione as fontes de dados e depois selecione Permissões de Edição... e certifique-se de que o Nível de Privacidade está definido como Público.

    Captura de ecrã do diálogo de definições da fonte de dados, mostrando que o Nível de Privacidade está definido para Público.

  • Para ativar a atualização agendada dos seus elementos visuais ou conjunto de dados em Python, precisa de ativar a atualização programada e ter um Gateway Pessoal instalado no computador que albergue o livro de exercícios e a instalação em Python. Para mais informações sobre ambos, consulte a secção anterior deste artigo, que fornece links para saber mais sobre cada um.

  • As tabelas aninhadas, que são tabelas de tabelas, atualmente não são suportadas.

Há todo o tipo de coisas que podes fazer com Python e consultas personalizadas, por isso explora e molda os teus dados exatamente como queres que apareçam.