Modelo de aplicativos analíticos em tempo real no Azure Cosmos DB for PostgreSQL

Aplica-se a: ✅ PostgreSQL

Importante

O Azure Cosmos DB para PostgreSQL não tem mais suporte para novos projetos. Não use esse serviço para novos projetos. Em vez disso, use um destes dois serviços:

Use o Azure Cosmos DB para NoSQL para uma solução de banco de dados distribuída projetada para cenários de alta escala com um SLA (contrato de nível de serviço de disponibilidade) de 99,999%, dimensionamento automático instantâneo e failover automático em várias regiões.
Use o Recurso Clusters Elásticos do Banco de Dados do Azure para PostgreSQL no PostgreSQL compartilhado usando a extensão de código aberto Citus.

Colocar tabelas grandes com chave de fragmento

Para escolher a chave de fragmento para um aplicativo de análise operacional em tempo real, siga estas diretrizes:

Escolher uma coluna comum nas tabelas grandes
Escolha uma coluna que seja uma dimensão natural nos dados ou uma parte central do aplicativo. Alguns exemplos:
- No mundo financeiro, um aplicativo que analisa tendências de segurança provavelmente usaria security_id.
- Em uma carga de trabalho de análise de usuário em que você deseja analisar as métricas de uso do site, user_id seria uma coluna de distribuição adequada

Ao colocar tabelas grandes, você pode enviar as consultas SQL para os nós de trabalho paralelamente. Enviar as consultas evita o embaralhamento de dados entre nós na rede. Operações como JOINs, agregações, rollups, filtros e LIMITs podem ser executadas com eficiência.

Para visualizar as consultas paralelas distribuídas nas tabelas colocadas, considere este diagrama:

Diagrama de junções que acontecem nos nós de trabalho.

As tabelas users e events são fragmentadas por user_id, portanto, as linhas relacionadas da mesma ID do usuário são unidas no mesmo nó de trabalho. Os JOINs do SQL podem ser executados sem obter informações entre os trabalhos.

Modelo de dados ideal para aplicativos em tempo real

Vamos continuar com o exemplo de um aplicativo que analisa as visitas ao site do usuário e as métricas. Há duas tabelas de "fatos", usuários e eventos, e outras tabelas de "dimensões" menores.

Diagrama de tabelas de usuários, de eventos e diversas.

Para aplicar a superpotência das tabelas distribuídas no Azure Cosmos DB for PostgreSQL, siga estas etapas:

Distribua grandes tabelas de fatos usando uma coluna comum. Em nosso caso, os usuários e eventos são distribuídos em user_id.
Marque as tabelas de dimensões/pequenas (device_types, countries e `event_types) como tabelas de referência.
Certifique-se de incluir a coluna de distribuição nas restrições de chave primária, única e estrangeira das tabelas distribuídas. A inclusão da coluna pode exigir uma chave composta. É necessário atualizar as chaves para as tabelas de referência.
Ao ingressar nas tabelas distribuídas grandes, faça-o usando a chave de fragmento.

-- Distribute the fact tables

SELECT create_distributed_table('users', 'user_id');
SELECT create_distributed_table('products', 'user_id', colocate_with => 'users');

-- Turn dimension tables into reference tables, with synchronized copies
-- maintained on every worker node

SELECT create_reference_table('countries');
-- similarly for device_types and event_types...

Próximas etapas

Agora terminamos de explorar a modelagem de dados para aplicativos escalonáveis. A próxima etapa é conectar e consultar o banco de dados com a linguagem de programação de sua escolha.

Pilhas de aplicativos >

Comentários

Esta página foi útil?

Last updated on 2025-10-30