Melhores práticas para otimizar a P e R no Power BI

É poderoso usar frases comuns e linguagem natural para fazer perguntas sobre seus dados. Ele é ainda mais eficiente quando seus dados respondem, que é o que o recurso Q&A no Power BI faz.

Para permitir que o Q&A interprete com êxito a grande coleção de perguntas às quais é capaz de responder, o Q&A faz suposições sobre o modelo. Se a estrutura do modelo não atender a uma ou mais dessas suposições, ajuste o modelo. Esses ajustes para Q&A são as mesmas otimizações de práticas recomendadas para qualquer modelo no Power BI, independentemente de você usar Q&A.

Use as ferramentas de P e R para corrigir suas perguntas

Nas seções a seguir, descrevemos como ajustar o modelo para que funcione bem com P e R no Power BI. Com as ferramentas de P e R, você ensina seus principais termos comerciais à P e R e corrige as perguntas feitas pelos usuários finais. Às vezes, as perguntas ainda não podem ser abordadas porque os dados são moldados incorretamente ou os dados estão ausentes. Nesse caso, leia as seções a seguir para ajudá-lo a otimizar o Q&A. Para obter mais informações, consulte Introdução às ferramentas de Q&A.

Adicionar relacionamentos ausentes

Se o modelo não tiver relações entre tabelas, os relatórios do Power BI e o Q&A não poderão interpretar como unir essas tabelas. Relacionamentos são a base de um bom modelo. Por exemplo, você não poderá solicitar o “total de vendas para clientes de Seattle” se a relação entre a tabela orders e a tabela customers estiver ausente. As imagens a seguir mostram um modelo que precisa de trabalho e um modelo pronto para Q&A.

Precisa de trabalho

Na primeira imagem, não há nenhuma relação entre as tabelas Customers, Sales e Products.

Captura de tela mostrando as tabelas Clientes, Vendas e Produtos sem relações conectadas.

Pronto para P e R

Na segunda imagem, as relações estão definidas entre as tabelas.

Captura de tela mostrando as tabelas Clientes, Vendas e Produtos com relações interconectadas.

Renomear tabelas e colunas

A escolha de tabelas e colunas é importante para P e R. Por exemplo, digamos que você tenha uma tabela chamada ResumoClientes que contenha uma lista de seus clientes. Você precisaria fazer uma pergunta como "Listar os resumos dos clientes em Chicago" em vez de "Listar os clientes em Chicago".

Embora a P e R possa fazer uma separação básica de palavras e a detecção de plurais, ela pressupõe que os nomes da tabela e da coluna refletem com precisão o conteúdo.

Outro exemplo pode ser se você tiver uma tabela chamada Headcount que contenha nomes e sobrenomes e números de funcionários. Você tem outra tabela chamada Funcionários que contém números de funcionários, números de trabalho e datas de início. Pessoas familiarizadas com o modelo talvez entendam essa estrutura. Alguém que pergunta "contagem dos funcionários" vai ter uma contagem das linhas da tabela "Funcionários". Provavelmente, esse resultado não é o que a pessoa tinha em mente, pois é uma contagem de todos os trabalhos dos quais todos os funcionários já participaram. Seria melhor renomear essas tabelas para refletir realmente o que elas contêm.

Precisa de trabalho

Nomes de tabelas como StoreInfo e Product List precisam de trabalho.

Captura de tela mostrando exemplos de nomes de tabela que não são ideais para Q e A.

Pronto para P e R

Tabelas chamadas Store e Products funcionam melhor.

Captura de tela mostrando exemplos de nomes de tabela ideais para Q e A.

Corrigir os tipos de dados incorretos

Dados importados podem ter tipos de dados incorretos. Em particular, as colunas data e número que são importadas como cadeias de caracteres não são interpretadas por P e R como datas e números. Selecione o tipo de dados correto no modelo do Power BI.

Captura de tela mostrando o painel Formatação com o tipo de dados e o formato De data e hora selecionados.

Alterar as configurações de coluna do ano e do identificador

O Power BI agrega colunas numéricas por padrão, portanto, perguntas como "vendas totais por ano" às vezes podem resultar em um total geral de vendas junto com um total geral de anos. Se você tiver colunas específicas em que não deseja que o Power BI exiba esse comportamento, defina a propriedade Summarization padrão na coluna como Não resumir. Lembre-se das colunas Ano, Mês, Dia e ID , pois essas colunas são os problemas mais frequentes. Outras colunas que não são sensatas para somar, como Idade, também podem se beneficiar da definição do Resumo padrão como Não resumir ou como Média. Essa configuração está na seção Propriedades depois que você seleciona uma coluna.

Captura de tela mostrando o campo Resumo com Não resumir selecionado.

Escolher uma categoria de dados para cada coluna de data e geografia

A Categoria de Dados fornece conhecimento sobre o conteúdo de uma coluna além de seu tipo de dados. Por exemplo, você pode marcar uma coluna inteira como um cep ou uma coluna de cadeia de caracteres como cidade, país/região. O Q&A usa essas informações de duas maneiras importantes, para seleção de visualização e para vieses de linguagem.

Em primeiro lugar, P e R usa as informações de Categoria de Dados para ajudar a tomar decisões sobre qual tipo de exibição visual será usado. Por exemplo, ele reconhece que colunas com categorias de dados de data ou hora são uma boa opção para o eixo horizontal de um gráfico de linhas ou o eixo de reprodução de um gráfico de bolhas. Ele pressupõe que os resultados que contêm colunas com categorias de dados geográficas podem parecer bons em um mapa.

Em segundo lugar, o Q&A faz algumas suposições educadas sobre como os usuários provavelmente falarão sobre colunas de data e geografia para ajudá-lo a entender certos tipos de perguntas. Por exemplo, "quando" em "Quando John Smith foi contratado?" é quase certo para mapear para uma coluna de data e "Brown" em "Contagem de clientes em Brown" é mais provável de ser uma cidade que uma cor de cabelo.

Captura de tela mostrando o campo Categoria de dados com Uncategorized selecionado.

Escolher uma classificação por coluna para as colunas relevantes

A propriedade Classificar por Coluna permite a classificação em uma coluna para classificar automaticamente uma coluna diferente. Por exemplo, quando pedir "classificar clientes por tamanho de chapéu", você provavelmente desejará que a coluna de tamanho de chapéu classifique pelo número de tamanho subjacente (XS, S, M, L, XL) em vez de em ordem alfabética (L, M, S, XL, XS).

Captura de tela mostrando a lista suspensa Classificar por coluna com a ID do Tamanho do Chapéu selecionada.

Normalizar seu modelo

Você não precisa remodelar todo o modelo. No entanto, certas estruturas são tão difíceis que as P e R não as manipula bem. Se você executar uma normalização básica da estrutura do modelo, a usabilidade dos relatórios do Power BI aumentará consideravelmente, junto com a precisão dos resultados da P e R.

Siga esta regra geral: cada "item" exclusivo abordado pelo usuário deve ser representado por exatamente um objeto do modelo (tabela ou coluna). Portanto, se seus usuários falam sobre clientes, deve haver um objeto cliente. Se os usuários falarem sobre vendas, deve haver um objeto de vendas . Há recursos avançados de modelagem de dados disponíveis em Editor de Consultas se você precisar deles. As transformações mais simples podem ser ajustadas usando cálculos no modelo do Power BI.

As seções a seguir contêm algumas transformações comuns que talvez você precise executar. Consulte Normalização versus desnormalização no artigo Noções básicas sobre o esquema em estrela e a importância do Power BI para obter mais informações sobre como normalizar um modelo.

Criar novas tabelas para entidades de várias colunas

Se você tiver várias colunas que atuam como uma única unidade distinta dentro de uma tabela maior, essas colunas deverão ser divididas em sua própria tabela. Por exemplo, digamos que você tenha uma coluna Nome do contato, Cargo do contato e Telefone do contato na tabela Empresas. Um design melhor seria ter uma tabela Contatos separada para conter o Nome, o Cargo e o Telefone, e um link para a tabela Empresas. Isso torna mais fácil fazer perguntas sobre contatos independentemente de perguntas sobre empresas para as quais eles são o contato e melhora a flexibilidade de exibição.

Precisa de trabalho

Captura de tela mostrando uma tabela Fornecedores que inclui informações de contato.

Pronto para P e R

Captura de tela mostrando duas tabelas, uma para Fornecedores e outra para Contatos.

Dinamizar para eliminar pacotes de propriedade

Se você tiver recipientes de propriedades no modelo, eles deverão ser reestruturados para ter uma única coluna por propriedade. Os sacos de propriedades, embora convenientes para gerenciar um grande número de propriedades, têm limitações inerentes que os relatórios do Power BI e o Q&A não foram projetados para resolver.

Por exemplo, considere uma tabela CustomerDemographics com as colunas CustomerID, Property e Value, em que cada linha representa uma propriedade diferente do cliente (por exemplo, idade, estado civil ou cidade). Ao sobrecarregar o significado da coluna Valor com base no conteúdo da coluna Propriedade, P e R não consegue interpretar a maioria das consultas que fazem referência a ela. Uma pergunta simples, como "mostrar a idade de cada cliente" pode funcionar, desde que ela possa interpretada como "mostrar os clientes e os dados demográficos do cliente em que a propriedade é idade". No entanto, a estrutura do modelo não dá suporte a questões mais complexas, como "idade média dos clientes em Chicago". Embora os usuários que criarem diretamente relatórios do Power BI possam encontrar maneiras inteligentes de obter os dados que estão procurando, o Q&A só funciona quando cada coluna tem um único significado.

Precisa de trabalho

Captura de tela mostrando três colunas com os títulos ID do Cliente, Propriedade e Valor.

Pronto para P e R

Captura de tela mostrando três colunas com os títulos ID do Cliente, Idade, Tamanho do Chapéu e Cidade.

União para eliminar o particionamento

Se você particionou seus dados em várias tabelas ou tem valores dinâmicos em várias colunas, algumas operações comuns são difíceis ou impossíveis de serem alcançadas pelos usuários. Considere primeiro uma tabela típica de particionamento: uma tabela Sales2000-2010 e uma tabela Sales2011-2020. Se todos os relatórios importantes forem restritos a uma década específica, provavelmente você poderia deixar desta forma para relatórios do Power BI. Porém, a flexibilidade da P e R leva os usuários a esperar respostas a perguntas como “total de vendas por ano”. Para que essa consulta funcione, você precisará unir os dados em uma única tabela de modelo do Power BI.

Da mesma forma, considere a possibilidade de uma coluna de valor dinâmico típico: uma tabela BookTour contendo as colunas Autor, Livro, Cidade1, Cidade2 e Cidade3. Com uma estrutura como essa, até mesmo perguntas simples como "contar livros por cidade" não podem ser interpretadas corretamente. Para que essa consulta funcione, crie uma tabela BookTourCities separada, que une os valores de cidade em uma única coluna.

Precisa de trabalho

Captura de tela mostrando uma tabela com colunas de valor dinâmico, Cidade 1, Cidade 2 e Cidade 3.

Pronto para P e R

Captura de tela mostrando duas tabelas, uma com informações de livro e autor para passeios e outra com cidades associadas aos passeios.

Dividir colunas formatadas

Se a fonte da qual você está importando os dados contiver colunas formatadas, os relatórios do Power BI (e a P e R) não acessarão o interior da coluna para analisar o conteúdo dela. Portanto, se você tiver, por exemplo, uma coluna Endereço Completo que contenha o endereço, a cidade e o país/região, também deverá dividi-la em colunas Address, City e CountryRegion para que os usuários possam consultá-las individualmente.

Precisa de trabalho

Captura de tela mostrando uma tabela com duas colunas, Cliente e Endereço Completo.

Pronto para P e R

Captura de tela mostrando uma tabela com cinco colunas, Cliente, Endereço completo, Endereço, Cidade e País ou Região.

Da mesma forma, se você tiver colunas de nome completo de uma pessoa, adicione as colunas Nome e Sobrenome, caso alguém queira fazer perguntas usando nomes parciais.

Criar novas tabelas para colunas com vários valores

Também em uma situação semelhante, se a fonte da qual você está importando os dados contiver colunas com vários valores, os relatórios do Power BI (e a P e R) não acessarão o interior da coluna para analisar o conteúdo. Portanto, se você tiver, por exemplo, uma coluna Composer que contém os nomes de vários compositores para uma canção, divida-a em várias linhas em uma tabela composers separada.

Precisa de trabalho

Captura de tela mostrando uma tabela com quatro colunas, ID, Nome, Gênero e Compositores.

Pronto para P e R

Captura de tela mostrando duas tabelas, uma com ID, Nome e Gênero e outra com ID e Compositor.

Desnormalizar para eliminar relacionamentos inativos

A única exceção à regra "normalização é melhor" ocorre quando há mais de um caminho a ser obtido de uma tabela para outra. Por exemplo, se você tiver uma tabela Voos com colunas SourceCityID e DestinationCityID, cada uma delas estará relacionada à tabela Cidades. Uma dessas relações precisa ser marcada como inativa. Como o Q&A só pode usar relações ativas, você não pode fazer perguntas sobre a origem ou o destino, dependendo do que você escolheu. Se, em vez disso, desnormalizar as colunas de nome da cidade na tabela Flights , você pode fazer perguntas como "listar os voos para amanhã com uma cidade de origem de Seattle e uma cidade de destino de São Francisco".

Precisa de trabalho

Captura de tela mostrando duas tabelas, Voos e Aeroportos.

Pronto para P e R

Captura de tela mostrando uma tabela chamada Flights. As colunas da tabela Aeroportos são adicionadas à tabela Flights.

Adicionar sinônimos a tabelas e colunas

Esta etapa aplica-se especificamente a P e R (e não a relatórios do Power BI em geral). Os usuários geralmente têm muitos termos que usam para se referir à mesma coisa, como vendas totais, vendas líquidas e vendas líquidas totais. Você pode adicionar esses sinônimos a tabelas e colunas no modelo do Power BI.

Esta etapa pode ser importante. Mesmo com nomes de tabelas e colunas simples, os usuários da P e R fazem perguntas usando o vocabulário que primeiro lhes vêm à mente. Eles não fazem escolhas em uma lista predefinida de colunas. Quanto mais sinônimos sensatos você adicionar, melhor será a experiência do usuário com seu relatório. Para adicionar sinônimos, em Power BI Desktop vá para o modo de exibição Modelo selecionando a guia Modelo e, em seguida, selecione um campo ou tabela. O painel Propriedades mostra a caixa Sinônimos, em que é possível adicionar sinônimos.

Captura de tela mostrando o painel Propriedades do Q&A com o campo Sinônimos realçado.

Lembre-se de que adicionar o mesmo sinônimo a mais de uma coluna ou tabela introduz ambiguidade. A P e R usa o contexto quando possível para escolher entre sinônimos ambíguos, mas nem todas as perguntas têm contexto suficiente. Por exemplo, quando um usuário pergunta "conte os clientes", se você tiver três coisas com o sinônimo "cliente" em seu modelo, o usuário poderá não obter a resposta que está procurando. Nesses casos, torne o sinônimo primário exclusivo porque esse sinônimo é o que é usado na reformulação. Ele pode alertar o usuário sobre a ambiguidade (por exemplo, uma reformulação de "mostrar o número de registros de clientes arquivados"), o que sugere que ele pode querer perguntar de forma diferente.

Próximas etapas

Introdução à P e R do Power BI