Modelos de fragmentação
APLICA-SE AO: Azure Cosmos DB for PostgreSQL (da plataforma da extensão de dados Citus para PostgreSQL)
A fragmentação é uma técnica usada em sistemas de banco de dados e computação distribuída para particionar dados horizontalmente em vários servidores ou nós. Isso envolve dividir um grande banco de dados ou conjunto de dados em partes menores e mais gerenciáveis chamadas Fragmentos. Um fragmento contém um subconjunto dos dados e, juntos, os fragmentos formam o conjunto de dados completo.
O Azure Cosmos DB for PostgreSQL oferece dois tipos de fragmentação de dados, ou seja, baseado em linha e baseado em esquema. Cada opção vem com suas próprias compensações de fragmentação, permitindo que você escolha a abordagem que melhor se alinha aos requisitos do aplicativo.
Fragmentação baseada em linha
A maneira tradicional em que as tabelas de fragmentos do Azure Cosmos DB for PostgreSQL são o banco de dados único, o modelo de esquema compartilhado também conhecido como fragmentação baseada em linha, os locatários coexistem como linhas dentro da mesma tabela. O locatário é determinado definindo uma coluna de distribuição, que permite dividir uma tabela horizontalmente.
Baseado em linha é a maneira mais eficiente de fragmentação de hardware. Os locatários são densamente empacotados e distribuídos entre os nós no cluster. No entanto, essa abordagem requer garantir que todas as tabelas no esquema tenham a coluna de distribuição e que todas as consultas no aplicativo sejam filtradas por ela. A fragmentação baseada em linha atua nas cargas de trabalho de IoT e para obter a margem melhor fora do uso de hardware.
Benefícios:
- Melhor desempenho
- Melhor densidade de locatário por nó
Desvantagens:
- Requer modificações de esquema
- Requer modificações de consulta de aplicativo
- Todos os locatários devem compartilhar o mesmo esquema
Fragmentação baseada em esquema
Disponível com o Citus 12.0 no Azure Cosmos DB for PostgreSQL, a fragmentação baseada em esquema é o banco de dados compartilhado, modelo de esquema separado, o esquema se torna o fragmento lógico dentro do banco de dados. Aplicativos multilocatários podem usar um esquema por locatário para fragmentar facilmente ao longo da dimensão do locatário. As alterações de consulta não são necessárias e o aplicativo precisa apenas de uma pequena modificação para definir o search_path adequado ao alternar locatários. A fragmentação baseada em esquema é uma solução ideal para microsserviços e para ISVs que implantam aplicativos que não podem passar pelas alterações necessárias para integrar a fragmentação baseada em linha.
Benefícios:
- Os locatários podem ter esquemas heterogêneos
- Não requer modificações de esquema
- Não requer modificações de consulta de aplicativo
- A compatibilidade do SQL de fragmentação baseada em esquema é melhor em comparação com a fragmentação baseada em linha
Desvantagens:
- Menos locatários por nó em comparação com a fragmentação baseada em linha
Compensações de fragmentação
Fragmentação baseada em esquema | Fragmentação baseada em linha | |
---|---|---|
Modelo de multilocação | Esquema separado por locatário | Tabelas compartilhadas com colunas de ID de locatário |
Versão do Citus | 12.0+ | Todas as versões |
Etapas extras em comparação com o vanilla PostgreSQL | Nenhum, apenas uma alteração de configuração | Usar create_distributed_table em cada tabela para distribuir e colocar tabelas por ID de locatário |
Número de locatários | 1-10k | 1-1 M+ |
Requisito de modelagem de dados | Nenhuma chave estrangeira em esquemas distribuídos | Precisa incluir uma coluna de ID de locatário (uma coluna de distribuição, também conhecida como chave de fragmentação) em cada tabela e, em chaves primárias, chaves estrangeiras |
Requisito do SQL para consultas de nó único | Usar um único esquema distribuído por consulta | As junções e cláusulas WHERE devem incluir a coluna tenant_id |
Consultas entre locatários paralelas | Não | Sim |
Definições de tabela personalizada por locatário | Sim | Não |
Controle de acesso | Permissões de esquema | Permissões de esquema |
Compartilhamento de dados entre locatários | Sim, usando tabelas de referência (em um esquema separado) | Sim, usando tabelas de referência |
Locatário para isolamento de fragmentos | Cada locatário tem seu próprio grupo de fragmentos por definição | Pode fornecer às IDs de locatário específicas seu próprio grupo de fragmentos por meio do isolate_tenant_to_new_shard |