Estratégias de arquitetura para otimizar o desempenho dos dados

Aplica-se a esta recomendação da lista de verificação de Eficiência de Desempenho do Azure Well-Architected Framework:

PE:08	Otimize o desempenho dos dados. Otimize armazenamentos de dados, partições e índices para seu uso pretendido e real na carga de trabalho.

Este guia descreve as recomendações para otimizar o desempenho dos dados. Otimizar o desempenho dos dados consiste em refinar a eficiência com que a carga de trabalho processa e armazena dados. Cada operação, transação ou computação de carga de trabalho normalmente depende da recuperação, processamento e armazenamento de dados rápidos e precisos. Quando o desempenho dos dados é otimizado, a carga de trabalho é executada sem problemas. O desempenho de dados comprometido cria um efeito dominó de baixa eficiência de desempenho. A falha em otimizar o desempenho dos dados resulta em atrasos de resposta, latência aumentada e escalabilidade reduzida. Compromete a eficiência de toda a carga de trabalho.

Definições

Term	Definition
Teorema da PAC	Uma estrutura usada para considerar consistência, disponibilidade e tolerância de partição para ajudar a explicar as compensações na consistência de dados.
Reconstrução do índice do banco de dados	Uma atividade de manutenção que cai e recria um índice.
Reorganização do índice de banco de dados	Uma atividade de manutenção que otimiza o índice do banco de dados atual.
Arquivo de dados	Um recurso que armazena dados como um banco de dados, armazenamento de objetos ou compartilhamento de arquivos.
Eventual consistência	Um modelo de sincronização de dados que permite inconsistência temporária em réplicas de dados antes que elas eventualmente sejam sincronizadas.
Index	Uma estrutura de banco de dados que fornece acesso rápido aos itens.
Processamento analítico online (OLAP)	Uma tecnologia que organiza grandes bancos de dados de negócios, suporta análises complexas e executa consultas analíticas complexas sem afetar negativamente os sistemas transacionais.
Processamento de transações online (OLTP)	Uma tecnologia que regista as interações empresariais à medida que ocorrem nas operações diárias de uma organização.
Concorrência otimista	Uma abordagem para atualizar bancos de dados que usa instantâneos para fazer atualizações em vez dos mecanismos tradicionais de bloqueio, melhorando o desempenho e a escalabilidade.
Teorema de PACELC	Uma estrutura usada para considerar a tolerância, disponibilidade, consistência e latência da partição para ajudar a explicar as compensações na consistência dos dados.
Partitioning	O processo de divisão física de dados em armazenamentos de dados separados.
Ajuste de consulta	Um processo que otimiza a velocidade de uma consulta de banco de dados.
Ler réplica	Uma cópia dinâmica de um banco de dados primário que permite descarregar o tráfego de leitura de um banco de dados de gravação.

Para otimizar o uso de dados, certifique-se de que os armazenamentos, partições e índices de dados sejam otimizados para o uso pretendido e para seu uso real em uma carga de trabalho. O uso otimizado de dados pode melhorar o desempenho da consulta, reduzir o consumo de recursos e melhorar a eficiência geral do sistema. Considere as seguintes estratégias:

Dados do perfil. Compreenda seus dados e garanta que seu modelo de dados seja adequado para sua carga de trabalho. Considere fatores como normalização de dados, estratégias de indexação e técnicas de particionamento. Para uma recuperação de dados eficiente, certifique-se de selecionar os tipos de dados apropriados, definir relações entre entidades e determinar uma estratégia de indexação ideal.
Ajuste sua configuração de armazenamento de dados. Configure sua infraestrutura de armazenamento de dados para alinhá-la com seus requisitos de carga de trabalho. Selecione uma tecnologia de armazenamento apropriada, por exemplo, bancos de dados relacionais, bancos de dados NoSQL e data warehouses. Otimize as configurações de armazenamento, como tamanho do buffer, mecanismos de cache e compactação.
Otimize o desempenho da consulta. Analise e otimize consultas executadas na carga de trabalho. Use técnicas como otimização de consultas, indexação e cache. Para identificar gargalos, use planos de consulta e ferramentas de monitoramento de desempenho e, em seguida, faça as melhorias necessárias.
Monitorize e ajuste regularmente o sistema. Monitore continuamente o desempenho de sua carga de trabalho e itere na configuração de armazenamento de dados e otimizações de consulta. Com base nas melhores práticas de ajuste de desempenho, analise as métricas do sistema, identifique áreas de melhoria e implemente mudanças.

Dados de perfil

A definição de perfis de dados envolve examinar os dados de uma fonte e coletar informações sobre eles. O objetivo é compreender a qualidade, a estrutura e as características dos dados da carga de trabalho. Esse processo permite a identificação de problemas como valores ausentes, duplicatas, formatos inconsistentes e outras anomalias. Para um perfil de dados eficaz, considere as seguintes estratégias:

Compreender a estrutura de dados. Examine a estrutura dos dados, incluindo tabelas, colunas e relações. Determine os tipos de dados, comprimentos e restrições que são aplicados a cada coluna. A avaliação da estrutura de dados ajuda a entender como os dados são organizados e como eles se relacionam com outros elementos de dados.
Analise o volume de dados. Avalie o volume de seus dados para entender o tamanho geral e os padrões de crescimento. Determine o número de registros ou documentos e o tamanho de tabelas ou coleções individuais. Essas informações ajudam a estimar os requisitos de armazenamento e identificar problemas de escalabilidade.
Identificar relações de dados. Explore as relações entre elementos de dados, como relações de chave primária e estrangeira. Entenda como os dados estão conectados, para que você possa determinar como as alterações em uma tabela ou documento podem afetar os dados relacionados.
Avalie a qualidade dos dados. Avalie a qualidade dos seus dados examinando fatores como integridade, precisão, consistência e exclusividade. Identifique anomalias de dados, valores ausentes ou registros duplicados que possam afetar a integridade dos dados e o desempenho da consulta. Esta etapa ajuda a identificar áreas para limpeza e melhoria de dados.
Capture a distribuição de dados. Analise a distribuição de valores dentro de cada coluna para determinar padrões de dados. Identifique valores frequentes e raros, valores atípicos e distorções de dados. Para otimizar o desempenho da consulta, escolha estratégias de indexação apropriadas e técnicas de otimização de consulta com base na distribuição.

Monitorar o desempenho dos dados

O monitoramento de desempenho de dados é a prática de rastrear consistentemente a eficiência de armazenamentos de dados, partições e índices em tempo real. Envolve a coleta e análise de métricas de desempenho específicas para operações de dados, usando ferramentas personalizadas para soluções de monitoramento no nível do sistema, específicas do banco de dados ou de terceiros. O monitoramento eficaz do desempenho de dados permite identificar e mitigar proativamente possíveis gargalos, garantindo que os processos e tarefas relacionados a dados sejam eficientes. Para monitorar o desempenho dos dados, considere as seguintes estratégias:

Colete métricas específicas de dados. Reúna métricas-chave diretamente relacionadas ao desempenho dos dados. Essas métricas incluem tempos de resposta de consulta, taxa de transferência de dados, E/S de disco relacionadas ao acesso a dados e tempos de carregamento de partições de dados específicas.
Configure alertas de dados. Configure alertas especificamente para métricas de dados. Use limites ou anomalias predefinidos nessas métricas para disparar alertas. Os alertas permitem que você receba notificações quando as métricas de desempenho excederem os intervalos aceitáveis ou mostrarem um comportamento anormal. Por exemplo, se uma consulta de banco de dados demorar mais do que o esperado ou se a taxa de transferência de dados cair significativamente, isso disparará um alerta. Você pode configurar esses alertas usando ferramentas de monitoramento especializadas ou scripts personalizados.
Diagnostique problemas de desempenho de dados. Analise regularmente as métricas de dados coletadas para identificar possíveis gargalos de desempenho ou degradação nas operações de dados. Ferramentas de visualização ou painéis podem ser inestimáveis nesse processo, ajudando a destacar tendências, gargalos e discrepâncias no desempenho de dados. Uma vez identificados, mergulhe nas causas profundas desses problemas e crie estratégias para as etapas de remediação apropriadas.

Dados de partição

O particionamento envolve a divisão de grandes conjuntos de dados ou cargas de trabalho de alto volume em subconjuntos menores e gerenciáveis. O particionamento melhora a eficiência do desempenho dos dados, distribuindo a carga de trabalho e melhorando o processamento paralelo. Também garante um acesso mais eficaz aos dados com base em necessidades específicas e padrões de consulta. Você pode particionar dados vertical ou horizontalmente (também chamado de fragmentação).

Estratégia	Definition	Example	Casos de uso
Particionamento vertical	Divida uma tabela em tabelas menores selecionando colunas ou campos específicos para cada partição. Cada partição representa um subconjunto dos dados completos.	Se você tiver uma tabela com as colunas A, B, C e D, poderá criar uma tabela com as colunas A e B e outra com as colunas C e D.	- Uma tabela contém muitas colunas, mas as consultas não acessam todas as colunas juntas. - Algumas colunas são maiores do que outras e separá-las pode aumentar o desempenho de E/S. - Diferentes partes de dados têm padrões de acesso diversos.
Particionamento horizontal	Divida dados com base em linhas ou intervalos de valores (também conhecido como fragmentação). Cada partição contém um subconjunto de linhas com características semelhantes.	Se você tiver uma tabela com linhas de 1 a 1000, poderá criar uma partição com linhas de 1 a 500 e outra com linhas de 501 a 1000.	- Um conjunto de dados é muito grande para um único local ou servidor. - Os dados são acessados com base em intervalos ou filtros específicos. - Necessidade de distribuir a carga de trabalho entre nós físicos ou servidores para melhorar o desempenho.

Para particionar seus dados, considere as seguintes etapas:

Analise dados e consultas. Analise dados e padrões de consulta para identificar estratégias adequadas de particionamento ou fragmentação. Compreender a natureza dos dados, os padrões de acesso e os requisitos de distribuição.
Determine uma chave. Escolha uma chave de particionamento ou fragmentação para distribuir dados entre partições ou fragmentos. Selecione cuidadosamente a chave com base nas características dos dados e nos requisitos de consulta.
Determine a lógica. Determine uma lógica de particionamento ou fragmentação com base na chave escolhida. Considere dividir os dados em intervalos, aplicar algoritmos de hash ou usar outras técnicas de particionamento.
Configure a infraestrutura. Configure o sistema de banco de dados para suportar particionamento ou fragmentação. Considere a criação da infraestrutura necessária, definindo as partições ou fragmentos e configurando a distribuição de dados.

Para obter mais informações, consulte Diretrizes de particionamento de dados.

Otimizar consultas de banco de dados

A otimização de consultas de banco de dados refina as consultas usando técnicas como dicas de índice e cache. Esses ajustes aumentam a eficiência e a velocidade de recuperação de dados. Como resultado, o banco de dados tem uma carga de trabalho mais leve, os recursos funcionam de forma mais eficaz e os usuários desfrutam de interações mais suaves. Para otimizar as consultas de banco de dados, considere as seguintes estratégias:

Reescreva consultas. Revise e analise consultas complexas para identificar oportunidades de reescrevê-las. Considere reestruturar a lógica de consulta, eliminar operações redundantes ou simplificar a sintaxe da consulta.
Evite o problema da consulta N+1. Minimize o número de viagens de ida e volta ao banco de dados usando junções e busca em lote para recuperar dados relacionados de forma eficiente.
Reordenar juntas. Avalie o plano de consulta e considere reorganizar a ordem de junção para minimizar o número de linhas em cada operação de junção. A ordem em que você une tabelas pode afetar o desempenho da consulta.
Use dicas de índice. Use dicas de índice para que um mecanismo de banco de dados possa especificar o uso de índices quando executa uma consulta. As dicas de índice orientam o otimizador a selecionar os índices mais apropriados.
Consultas de cache. Armazene os resultados de consultas executadas com frequência na memória. O cache de consultas elimina a necessidade de executar repetidamente a mesma consulta e reduz a sobrecarga de processamento de consultas.
Otimize o bloqueio. Evite dicas de bloqueio desnecessárias ou restritivas em consultas. Estratégias de bloqueio eficientes podem melhorar o desempenho e a simultaneidade da consulta. Aplique mecanismos de bloqueio otimizados que o sistema de banco de dados fornece. Analise e ajuste os níveis de isolamento para equilibrar a consistência dos dados e o desempenho da consulta.
Monitorize e afine. Monitore métricas de desempenho de consulta, como tempo de execução, utilização de recursos e taxa de transferência de consulta. Use ferramentas de criação de perfil de banco de dados e funcionalidades de monitoramento para identificar consultas com baixo desempenho. Avalie e ajuste os planos de consulta com base nos dados de desempenho coletados. Analise planos de consulta e aguarde estatísticas para identificar gargalos. Use essas informações para otimizar o desempenho da consulta.

Otimize o desempenho do índice

Os índices aumentam a velocidade de recuperação de dados, permitindo que os bancos de dados localizem dados rapidamente usando colunas ou campos específicos. Quando você otimiza esses índices, as operações de classificação e junção se tornam mais eficientes, levando a consultas mais rápidas. Índices bem otimizados reduzem as operações de E/S de disco necessárias para consultas. A remoção de índices desnecessários ou redundantes também libera espaço de armazenamento valioso. Para otimizar o desempenho do índice, considere as seguintes estratégias:

Analise padrões de consulta. Compreenda os padrões de consulta executados em seu banco de dados. Identifique as consultas que são executadas com frequência e podem prejudicar o desempenho. Analise padrões de consulta para determinar quais índices são benéficos para otimizar o desempenho.
Avalie os índices existentes. Revise os índices existentes em seu banco de dados. Avalie seu uso, efeitos de desempenho e relevância para os padrões de consulta. Identifique índices redundantes ou não utilizados que você pode remover para melhorar o desempenho de gravação e reduzir a sobrecarga de armazenamento.
Identificar colunas para indexação. Identifique as colunas que são usadas com freqüência nas cláusulas onde, junção e ordem por suas consultas. Essas colunas são candidatas potenciais para indexação porque podem permitir a recuperação rápida de dados.
Escolha um tipo de índice apropriado. Selecione um tipo de índice apropriado com base no seu sistema de banco de dados. As opções comuns incluem índices de árvore b para consultas de igualdade e intervalo, índices de hash para consultas de correspondência exata e índices de texto completo para operações de pesquisa de texto. Escolha um tipo de índice que melhor corresponda aos seus requisitos de consulta.
Considere a ordem das colunas do índice. Ao criar índices compostos ou índices com várias colunas, considere a ordem das colunas. Coloque as colunas mais usadas em consultas no início do índice. A ordem das colunas ajuda a garantir que sua carga de trabalho esteja usando índices de forma eficaz para uma ampla variedade de consultas.
Tamanho do índice de equilíbrio. Evite criar índices em colunas com baixa cardinalidade ou colunas que tenham um número baixo de valores distintos. Esses índices podem ser ineficientes e aumentar o tamanho do seu banco de dados. Em vez disso, colunas de índice que têm uma alta seletividade.
Manter o uso do índice. Monitore continuamente o uso e o desempenho de seus índices. Procure oportunidades para criar novos índices ou modificar índices existentes com base em alterações nos padrões de consulta ou requisitos de desempenho. Remova ou atualize índices que não são mais benéficos. Os índices têm despesas gerais de manutenção. À medida que os dados mudam, os índices podem fragmentar e afetar o desempenho. Execute regularmente tarefas de manutenção de índices, como reconstruir ou reorganizar índices, para garantir um desempenho ideal.
Testar e validar. Antes de revisar índices em um ambiente de produção, execute testes e validações completos. Meça o efeito de desempenho de revisões de índice usando cargas de trabalho representativas. Verifique as melhorias em relação a parâmetros de referência predefinidos.

Compensação: os índices da árvore B podem ter alta sobrecarga de armazenamento e as consultas de correspondência exata podem ser lentas. Os índices de hash não são adequados para consultas de intervalo ou operadores de comparação. Os índices de texto completo podem ter altos requisitos de armazenamento e as consultas de dados não textuais podem ser lentas.

Considere a compactação de dados

A compactação de dados é o processo de reduzir o tamanho dos dados para otimizar o espaço de armazenamento e melhorar a eficiência do desempenho da carga de trabalho. Dados compactados requerem menos espaço de armazenamento e menos largura de banda para transmissão, o que resulta em transferência de dados rápida. Você compactaria os dados para reduzir o espaço ocupado pelo armazenamento e melhorar os tempos de acesso aos dados. Quando você compacta dados, reduz as operações de E/S e os requisitos de largura de banda da rede.

Compressão sem perdas e compressão com perdas são algoritmos de compressão de dados. Os algoritmos de compressão sem perdas reduzem o tamanho dos dados sem perder nenhuma informação. Os algoritmos de compressão com perdas alcançam altas taxas de compressão removendo informações menos importantes ou redundantes.

Compensação: para compactar e descompactar dados, você precisa de recursos computacionais, como CPU e memória. Quanto mais dados você compactar, mais recursos você precisa.

Arquivar e limpar dados

O arquivamento e a limpeza são estratégias que simplificam o armazenamento de dados. O arquivamento realoca dados mais antigos e acessados com menos frequência para um armazenamento mais econômico. A limpeza de dados remove permanentemente os dados redundantes. Eles contribuem para a eficiência do desempenho, reduzindo o volume de dados, aumentando a velocidade de acesso aos dados e reduzindo os tempos de backup e recuperação:

Reduzir o volume de dados: Menos dados significa tempos de processamento mais rápidos, garantindo respostas rápidas às solicitações dos usuários.
Aumento da velocidade de acesso aos dados: Um conjunto de dados cortado permite consultas e recuperação de dados mais rápidas, otimizando a capacidade de resposta do sistema.
Redução dos tempos de backup e recuperação: conjuntos de dados menores agilizam os processos de backup e restauração, minimizando o tempo de inatividade e garantindo um desempenho consistente.

O arquivamento e a limpeza são fundamentais para manter a eficiência máxima de desempenho em sistemas orientados por dados.

Otimize a carga de armazenamento

Otimizar a carga de armazenamento significa simplificar as solicitações ao sistema de armazenamento. Ajuda a eliminar pedidos desnecessários. Também melhora a recuperação de dados e evita sobrecarregar o armazenamento. A otimização da carga de armazenamento garante que o sistema de armazenamento permaneça responsivo às solicitações legítimas e mantenha o desempenho máximo. Implementar estratégias para reduzir a carga de processamento no armazenamento de dados. Para otimizar a carga do armazenamento de dados, considere as seguintes estratégias:

Usar cache

O cache armazena dados comumente acessados em uma área de armazenamento de acesso rápido, tornando a recuperação de dados mais rápida do que retirá-los da fonte principal. Essa técnica aumenta o desempenho dos dados, reduzindo os tempos de acesso e evitando buscas repetitivas de dados. O cache melhora as velocidades de leitura e os tempos de resposta do usuário, especialmente para dados acessados com frequência Este método é mais eficaz em dados estáticos ou dados que raramente mudam.

Para garantir a eficiência ideal do cache, considere fatores como políticas de expiração, estratégias de remoção e gerenciamento do tamanho do cache. Ajuste as configurações, como o tempo de vida (TTL), para um desempenho ideal. Para usar um cache para otimizar a carga de armazenamento, considere as seguintes estratégias:

Cache na memória: execute o cache na memória para armazenar dados acessados com frequência na memória para recuperação rápida. Você pode usar essa técnica para dados de aplicativos que são caros para calcular ou recuperar de um banco de dados. O cache na memória é útil para dados que você lê com frequência, mas não muda com frequência.
Cache de consulta de banco de dados: use essa técnica para armazenar em cache os resultados de consultas de banco de dados para evitar executar a mesma consulta várias vezes. O cache de consultas de banco de dados é útil para consultas de banco de dados complexas e demoradas. Quando você armazena em cache os resultados de uma consulta, as solicitações subsequentes para a mesma consulta são retornadas rapidamente.
Cache de rede de entrega de conteúdo: use esta técnica para armazenar em cache conteúdo da Web em servidores de rede distribuída para reduzir a latência e melhorar a entrega de conteúdo. O cache da rede de entrega de conteúdo é eficaz para conteúdo estático, como imagens, arquivos CSS e arquivos JavaScript. As redes de distribuição de conteúdo armazenam cópias de conteúdo em vários locais em todo o mundo, para que os usuários possam acessar o conteúdo de um servidor que está perto deles geograficamente.

Usar réplicas de leitura

Muitos bancos de dados suportam várias réplicas de leitura. Distribua consultas de leitura entre réplicas para minimizar a demanda no banco de dados de gravação. Cada réplica de leitura pode servir um subconjunto de tráfego, o que pode melhorar o desempenho.

Quando você tem uma carga de trabalho com várias réplicas de dados que espera manter sincronizadas, é útil modelar esse sistema distribuído usando o teorema PACELC. O teorema PACELC ajuda você a entender as opções de compensação de latência versus constância no estado não particionado do sistema. Use essas informações para ajudá-lo a escolher um mecanismo de banco de dados e uma estratégia de sincronização de dados que melhor aborde o sistema em um estado particionado e não particionado. Para obter mais informações, consulte Padrão CQRS (Command and Query Responsibility Segregation).

Otimize a consistência dos dados

Em uma carga de trabalho distribuída, onde os dados residem em vários nós ou locais, o nível de consistência selecionado determina a rapidez com que as alterações em um local refletem em outros. Optar por uma consistência mais rigorosa consome mais recursos de computação e pode afetar negativamente a eficiência do desempenho. Por outro lado, um nível de consistência menos rigoroso, como uma eventual consistência, introduz inconsistências temporárias entre nós, mas pode aumentar a eficiência do desempenho.

A consistência eventual atinge um equilíbrio entre a precisão dos dados e o desempenho da carga de trabalho. As alterações se espalham gradualmente em vez de instantaneamente, aumentando a capacidade de resposta da carga de trabalho e a velocidade de processamento de dados. Embora introduza inconsistências de curta duração, a carga de trabalho eventualmente apresenta dados consistentes em todos os nós. Escolher uma eventual consistência pode elevar o desempenho de uma carga de trabalho e melhorar ainda mais sua disponibilidade e escalabilidade.

Otimizar atualizações de dados

Você pode usar simultaneidade otimista para lidar com atualizações simultâneas para os mesmos dados. Em vez de bloquear dados e impedir outras atualizações, a simultaneidade otimista permite que vários usuários ou processos trabalhem simultaneamente e pressupõe que os conflitos são raros.

Com simultaneidade otimista, cada operação de atualização inclui uma versão ou carimbo de data/hora que representa o estado dos dados no momento da atualização. Quando uma atualização conflitante é detetada, o sistema resolve o conflito rejeitando a atualização ou mesclando as alterações.

A simultaneidade otimista minimiza a contenção e permite que atualizações simultâneas prossigam sem bloqueio desnecessário. Ele reduz o tempo de espera por recursos e fornece alta taxa de transferência.

Otimize a movimentação e o processamento de dados

A otimização da movimentação e do processamento de dados envolve a melhoria da eficiência e do desempenho das operações relacionadas à extração, transformação, carregamento e processamento de dados. Considere os seguintes aspectos-chave da otimização da movimentação e do processamento de dados:

Otimização de extração, transformação e carregamento (ETL): otimize os processos de ETL para minimizar o tempo de processamento. Você pode simplificar o processo de extração, implementar algoritmos de transformação eficientes e otimizar o processo de carregamento. Ao tornar cada etapa eficiente, você pode otimizar o fluxo de trabalho geral.
Processamento paralelo: Utilize técnicas de processamento paralelo para melhorar o desempenho. Ao distribuir tarefas de processamento de dados em vários threads ou nós, você pode dividir e processar a carga de trabalho simultaneamente, o que resulta em processamento rápido.
Processamento em lote: agrupe tarefas semelhantes para reduzir a sobrecarga causada por operações repetidas. Processe várias tarefas em um lote para reduzir o tempo geral de processamento.

Otimize o projeto de armazenamento

A otimização do projeto de armazenamento envolve a criação de uma arquitetura de armazenamento de dados precisa e a seleção de tecnologias de armazenamento apropriadas. Um design de armazenamento simplificado melhora o acesso, a recuperação e a manipulação de dados. Por meio do projeto estratégico de armazenamento, uma carga de trabalho alcança tempos de resposta aprimorados e funcionalidade geral.

Design para proximidade de dados

A proximidade de dados refere-se à colocação estratégica dos dados mais perto dos utilizadores ou serviços que os acedem com maior frequência. Ao reduzir a distância física ou lógica entre os dados e os seus utilizadores, a proximidade dos dados garante um acesso mais rápido aos dados e uma melhor capacidade de resposta. Para otimizar o projeto para proximidade, considere estas estratégias:

Avalie padrões de acesso a dados: avalie os padrões de acesso da sua carga de trabalho e os dados acessados com frequência. Essa análise pode ajudar a determinar onde colocar os dados para obter o máximo benefício.
Escolha soluções que suportem a realocação de dados: considere soluções que ofereçam realocação dinâmica de dados com base em padrões de acesso em mudança, garantindo o posicionamento ideal dos dados.
Escolha soluções que ofereçam suporte à sincronização de dados: se atender a uma base de usuários distribuída, opte por soluções que facilitem a sincronização de dados entre várias regiões, garantindo que as réplicas de dados estejam disponíveis na proximidade dos usuários.

Compensação: Se os dados subjacentes forem alterados com frequência, implemente um mecanismo de invalidação de cache para garantir que os dados armazenados em cache permaneçam atualizados.

Usar persistência poliglota

A persistência poliglota é a prática de usar várias tecnologias de armazenamento de dados para armazenar e gerenciar diferentes tipos de dados dentro de um aplicativo ou sistema. Diferentes tipos de bancos de dados ou soluções de armazenamento atendem a diferentes requisitos de dados.

A persistência poliglota aproveita os benefícios de cada tecnologia de armazenamento de dados para garantir o desempenho e a escalabilidade ideais para cada tipo de dados. Por exemplo, você pode usar um banco de dados relacional para armazenar dados transacionais estruturados. E você pode usar um banco de dados NoSQL para armazenar dados não estruturados ou semiestruturados.

Projete um esquema para cada tecnologia de armazenamento de dados com base nos requisitos dos dados. Para bancos de dados relacionais, você pode criar tabelas normalizadas com relações apropriadas. Para bancos de dados NoSQL, você pode definir estruturas de documentos ou pares chave-valor. Desenvolva os componentes necessários para interagir com cada tecnologia de armazenamento de dados, como APIs, camadas de acesso a dados ou pipelines de integração de dados. Certifique-se de que o aplicativo possa ler e gravar dados nos armazenamentos de dados apropriados.

Compensação: uma estrutura de dados com baixa normalização pode melhorar o desempenho, mas introduzir complexidades.

Sistemas OLTP e OLAP separados

Para separar sistemas OLTP e OLAP , projete e implante sistemas distintos para processamento transacional e tarefas de processamento analítico. Essa separação permite otimizar cada sistema para sua carga de trabalho e características específicas.

Os sistemas OLTP são usados para processamento transacional em tempo real. Eles lidam de forma eficiente e confiável com transações individuais. Os sistemas OLTP são normalmente usados para executar tarefas operacionais diárias, como processamento de pedidos on-line, gerenciamento de estoque e gerenciamento de dados de clientes. Os sistemas OLTP priorizam a capacidade de resposta, consistência e simultaneidade.

Os sistemas OLAP são usados para processamento analítico complexo e emissão de relatórios. Eles lidam com grandes volumes de dados e realizam cálculos e agregações intensivos. Os sistemas OLAP são usados para tarefas como business intelligence, mineração de dados e suporte a decisões. Os sistemas OLAP priorizam o desempenho da consulta, a agregação de dados e a análise multidimensional.

Ao separar sistemas OLTP e OLAP, você pode alocar recursos apropriados e otimizar cada sistema para sua carga de trabalho específica. A separação permite aplicar diferentes técnicas de modelagem de dados a cada sistema. Os sistemas OLTP normalmente usam esquemas normalizados para processamento transacional eficiente. Os sistemas OLAP podem usar esquemas desnormalizados ou técnicas de armazenamento de dados para otimizar o desempenho da consulta.

Facilitação do Azure

Dados de criação de perfil: o Azure oferece ferramentas e serviços que você pode usar para criar perfis de dados, como o Catálogo de Dados do Azure, o Azure Purview e o Azure Synapse Analytics. Essas ferramentas permitem extrair, transformar e carregar dados de várias fontes, realizar verificações de qualidade de dados e obter informações sobre os dados.

Monitorando o desempenho dos dados: para monitorar o desempenho dos dados, você pode usar o Azure Monitor para coletar e analisar métricas de infraestrutura, logs e dados de aplicativos. Você pode integrar o Monitor com outros serviços, como o Application Insights. O Application Insights fornece monitoramento de desempenho de aplicativos e suporta muitas plataformas.

O Application Insights coleta dados de uso e desempenho. Você pode usar o Log Analytics para correlacionar esses dados com dados de configuração e desempenho nos recursos do Azure.

Você pode usar o recurso de insights do Azure SQL e do Azure Cosmos DB para monitorar seu banco de dados. Esse recurso permite diagnosticar e ajustar problemas de desempenho do banco de dados.

Particionamento de dados: o Azure oferece várias estratégias de particionamento para diferentes armazenamentos de dados. Cada armazenamento de dados pode ter diferentes considerações e opções de configuração para particionamento de dados. Para obter mais informações, consulte Estratégias de particionamento de dados.

Otimizando consultas de banco de dados e desempenho de índice: use o recurso de perceção de desempenho de consulta do Banco de Dados SQL do Azure para otimizar consultas, tabelas e bancos de dados. Você pode usar esse recurso para identificar e solucionar problemas de desempenho de consulta.

Para bancos de dados relacionais, você deve seguir as diretrizes de design de índice, as diretrizes de índice do SQL Server e as diretrizes de índice do Azure Cosmos DB. Use o Banco de dados SQL para executar o ajuste automático de consultas para melhorar seu desempenho.

Em bancos de dados SQL, você deve reorganizar ou reconstruir índices regularmente. Identifique consultas lentas e ajuste-as para melhorar o desempenho. Muitos mecanismos de banco de dados têm recursos de ajuste de consulta. Para obter mais informações, consulte Práticas recomendadas para o desempenho da consulta.

O Azure Cosmos DB tem uma política de indexação padrão que indexa todas as propriedades de cada item e impõe índices de intervalo para qualquer cadeia de caracteres ou número. Essa política fornece um desempenho de consulta eficiente e você não precisa gerenciar índices antecipadamente.

Otimizando a carga de armazenamento: muitos serviços de banco de dados do Azure oferecem suporte a réplicas de leitura. A disponibilidade e a configuração das réplicas de leitura variam dependendo do serviço de banco de dados do Azure. Consulte a documentação oficial de cada serviço para entender os detalhes e opções.

Otimizando o design de armazenamento: o Azure oferece muitos armazenamentos de dados diferentes para atender às suas necessidades de carga de trabalho. Entenda os tipos de armazenamento de dados e selecione um repositório de dados do Azure para seu aplicativo.

Lista de verificação de eficiência de desempenho

Consulte o conjunto completo de recomendações.

Lista de verificação de eficiência de desempenho

Comentários

Esta página foi útil?

Last updated on 2025-08-29

Estratégias de arquitetura para otimizar o desempenho dos dados

Dados de perfil

Monitorar o desempenho dos dados

Dados de partição

Otimizar consultas de banco de dados

Otimize o desempenho do índice

Considere a compactação de dados

Arquivar e limpar dados

Otimize a carga de armazenamento

Usar cache

Usar réplicas de leitura

Otimize a consistência dos dados

Otimizar atualizações de dados

Otimize a movimentação e o processamento de dados

Otimize o projeto de armazenamento

Design para proximidade de dados

Usar persistência poliglota

Sistemas OLTP e OLAP separados

Facilitação do Azure

Ligações relacionadas

Lista de verificação de eficiência de desempenho

Comentários

Recursos adicionais