Agregação de dados

Concluído

As funções de agregação são usadas para retornar um valor de resumo do conjunto de dados e são um componente fundamental da análise de dados. Essas funções nos ajudam a responder perguntas específicas sobre nosso negócio, como quantos clientes visitaram a loja de Tóquio na última terça-feira, ou o gasto médio de cada cliente online em dezembro.

As seguintes funções são comumente usadas na análise de dados:

  • Contagem – Um bom ponto de partida antes de começar uma análise mais detalhada é usar a função de contagem para retornar o número de registros em seu conjunto de dados. A função de contagem pode ser aplicada a qualquer conjunto de dados, independentemente do tipo de dados que contém, pois o cálculo é feito no número de linhas.

  • Contagem distinta – uma contagem distinta pode ser aplicada para retornar o número de valores exclusivos em uma coluna e é útil para dados categóricos.

  • Soma – uma função comum que resume os valores totais em um campo. Ele é usado para retornar valores como vendas totais ou receita.

  • Média – a função média calcula a soma de um campo, dividida pelo número de registros. Por exemplo, para descobrir o gasto médio do cliente, a função média executaria um cálculo de soma em relação aos gastos de todos os clientes e, em seguida, dividiria-o pelo número de clientes na tabela.

  • Mínimo – uma função que é usada para retornar o valor mais baixo em um campo.

  • Máximo - O oposto da função mínima, essa função retorna o valor mais alto em um campo.

O tipo de função usada depende dos dados na coluna que está sendo agregada. Os valores de temperatura em uma coluna não funcionariam com uma agregação de resumo, mas seriam ideais para mínimo, máximo ou média. Em uma tabela de pedidos de vendas, a coluna total pode ser resumida ou você pode usar as funções mínima, máxima ou média.

Neste vídeo, você verá como as funções de agregação podem ser aplicadas aos dados para retornar resultados resumidos: