Partilhar via


Gerar e armazenar dados de métricas

Após a geração da tabela agregada, pode executar a lógica de cálculo (agregação ou cálculo) definida na definição da métrica no conjunto de dados da tabela agregada para gerar os dados de saída da métrica.

A lógica de cálculo de uma métrica é definida com:

  • Medidas do Power BI: contém lógica de cálculo sob a forma de linguagem de fórmulas DAX (Data Analysis Expressions). As medidas do Power BI são definidas no modelo semântico pré-criado DatasetForMetricsMeasures_DTST, implementado como parte da capacidade. Para obter mais informações sobre as medidas do Power BI, aceda a Criar medidas para análise de dados no Power BI Desktop na documentação do Power BI.

  • Dimensões: especifica as dimensões/colunas necessárias na saída da métrica. Estas dimensões podem ser provenientes de tabelas agregadas ou de tabelas calculadas no modelo semântico DatasetForMetricsMeasures_DTST.

  • Filtros: especifica os valores das dimensões da tabela agregada que necessitam de ser filtrados.

uma amostra de métrica pré-criada de emissões por categoria do Âmbito 3 (protocolo de GEE).

A seguir é apresentada a definição da métrica deste ficheiro metrics_definitions_config.json:

{
      "metric_name": "Scope 3 GHG emissions by category (GHG Protocol)",
      "measure_name": "Emissions",
      "dimensions": [
        "EmissionsAggregate[EmissionSource]",
        "EmissionsAggregate[UnitOfMeasureName]",
        "EmissionsAggregate[ReportingPeriod]"
      ],
      "filters": {
        "EmissionsAggregate[isRolledUp]": [
          "False"
        ],
        "EmissionsAggregate[Scope]": [
          "Scope 3"
        ],
        "EmissionsAggregate[AccountingMethod]": [
          "Location based",
          null
        ],
        "EmissionsAggregate[UnitOfMeasureName]": [
          "mtCO2e"
        ]
      },
      "sustainability_area": "Climate Change",
      "labels": {
        "Reporting standard": [
          "CSRD"
        ],
        "Disclosure datapoint": [
          "E1-6_04"
        ]
      }
    }

Com base na definição da métrica, a saída da métrica consiste em:

  • As colunas especificadas como dimensões na definição de métrica
  • A coluna de valor que é calculada pela execução da lógica de cálculo especificada na definição de métrica

Para a métrica de exemplo, estas colunas de saída são:

  • EmissionSource: captura o nome da categoria do âmbito 3.
  • Nome da unidade de medida: menciona a unidade de medida do valor de emissão, como mtCO2e.
  • Período de reporte: especifica o ano de reporte.
  • Valor: captura o valor de emissão para uma categoria de âmbito 3 para um período de reporte específico.

Para esta métrica, é necessário calcular a soma de CO2eEmissionsUnits, em que o Âmbito é Âmbito 3 e o AccountingMethod é nulo ou Com base na localização na Fonte de emissão e no Período de reporte da tabela EmissionsAggregate.

Este cálculo é realizado da seguinte forma pela lógica de cálculo especificada na definição de métrica:

  1. A medida Emissões realiza a soma de CO2eEmissions da tabela EmissionsAggregate e é definida no modelo semântico DatasetForMetricsMeasures_DTST:

    Primeira captura de ecrã de uma definição de métrica.

    Para ver as medidas pré-criadas do Power BI que são utilizadas para calcular as métricas pré-criadas, siga os seguintes passos:

    1. Abra DatasetForMetricsMeasures_DTST a partir da área de trabalho.
    2. Selecionar Abrir modelo de dados.
    3. Selecione ESG_measures a partir do painel lateral Dados.

    Se Abrir modelo de dados estiver acinzentado, navegue até Definição da área de trabalho. Abra o Power BI/Geral e ative a definição Os utilizadores podem editar modelos de dados no serviço do Power BI.

  2. A medida Dimensões executa a agregação nas dimensões especificadas nas colunas de definição de métrica (período de reporte), fonte de emissão e unidade de medida da tabela agregada. Estas colunas das dimensões da saída da métrica.

  3. Filtros especifica os valores necessários para diferentes colunas da tabela EmissionsAggregate a somar pela medição. Neste exemplo, linhas em que o âmbito é o âmbito 3, o método de gestão contabilística é nulo ou baseado na localização e a unidade de medida é mtCO2e.

Para calcular os dados das métricas com as medidas, dimensões e filtros do Power BI, o bloco de notas pré-criado utiliza a função evaluate_measure da interface Python da biblioteca Python da associação semântica, SemPy.

Pré-requisitos para gerar dados de métricas

  • A tabela agregada necessária para gerar a métrica já deve estar presente no lakehouse ComputedESGMetrics_LH.
  • Antes de executar a lógica de cálculo para uma métrica, certifique-se de que as definições das métricas são carregadas como tabelas no lakehouse ComputedESGMetrics. A menos que atualize a definição de métrica, não será necessário recarregar as definições. Execute o bloco de notas Carregar definição de métrica diretamente ou execute a atividade Carregar definição de métrica do pipeline ExecuteComputationForMetrics.

Gerar e armazenar os dados de métricas

  1. Execute a atividade Gerar saída para métricas no pipeline ExecuteComputationOfMetrics_DTPL ou execute diretamente o bloco de notas GenerateOutputForMetrics_INTB para executar a lógica de cálculo de métricas no conjunto de dados da tabela agregada e armazenar os dados de saída na tabela ComputedESGMetrics no lakehouse ComputedESGMetrics_LH.

    Primeira captura de ecrã da geração de dados.

    Pode especificar estes parâmetros para gerar saídas para um conjunto específico de métricas. Se pretender gerar uma saída para todas as definições de métricas carregadas na tabela MetricsDefinitions, não especifique um valor de parâmetro no pipeline e defina-o como Nenhum no bloco de notas

    Nota

    Os valores dos parâmetros são sensíveis às maiúsculas e minúsculas.

    • metric_names: especifique uma lista de nomes de métricas. Pode obter o nome das métricas em Biblioteca de métricas pré-criadas ou consultar a tabela MetricsDefinitions no lakehouse ComputedESGMetrics_LH. Por exemplo, ["Emissões de GEE do âmbito 3 por categoria (Protocolo de GEE)", "Consumo total de água"].

    • sustainability_areas: especifique uma lista de áreas de sustentabilidade. Por exemplo, ["Alterações Climáticas","Recursos hídricos e marinhos"]. Todas as métricas mapeadas para a área de sustentabilidade especificada no parâmetro são consideradas para cálculo. Pode encontrar a área de sustentabilidade que está mapeada para a métrica a partir da Biblioteca de métricas pré-criadas ou consultar a tabela MetricsDefinitions no lakehouse ComputedESGMetrics_LH.

    Nota

    Se especificar sustainability_areas e metric_names, o parâmetro metric_names terá prioridade e será considerado para cálculo.

  2. Após a execução bem-sucedida da atividade do bloco de notas ou do pipeline, pode verificar as saídas de métricas na tabela ComputedESGMetrics no lakehouse ComputedESGMetrics_LH. ComputedESGMetrics é uma única tabela que armazena a saída de todas as métricas. Esta tabela mostra os detalhes do esquema da tabela.

    Nome da coluna Description
    MetricId O identificador exclusivo da métrica. Indica a métrica para a qual os dados são gerados. É uma chave externa para a tabela MetricsDefinitions.
    ReportingPeriod Indica o período de reporte (ano) para o qual o valor da métrica é gerado.
    UnitOfMeasureName Representa a unidade de medida do valor métrico (como mtCO2e para os valores de emissões).
    valor Indica o valor da métrica para o ReportingPeriod e o DimensionValue específicos.
    DimensionName Se a saída da métrica tiver outra dimensão para além de ReportingPeriod, este nome de dimensão será especificado na coluna DimensionName. O valor correspondente está em DimensionValue, e o tipo de dados está em DimensionType.
    DimensionValue Contém o valor específico para a dimensão especificada na coluna DimensionName.
    DimensionType Especifica o tipo de dados da dimensão em DimensionName.
    Index Index e MetricId identificam exclusivamente uma linha específica de uma métrica. Esta coluna é útil quando se obtém uma saída da métrica específica com dimensões como colunas separadas desta única tabela de saída da métrica.

    Se pretender armazenar os dados de cada métrica como um dataframe ou tabela separado, pode utilizar a função get_metric_output_by_id para obter o dataframe de saída da métrica.

Próximo passo