Partilhar via


Fabrico de armazenamento HPC

O acesso ao armazenamento é uma parte importante do planejamento do desempenho da carga de trabalho de HPC. Os materiais a seguir ajudam a simplificar seu processo de decisão e minimizar quaisquer mal-entendidos em torno dos recursos (ou falta de recursos) de uma determinada solução de armazenamento.

Considerações de design

É importante garantir que os dados necessários cheguem às máquinas de cluster HPC no momento certo. Você também quer garantir que os resultados dessas máquinas individuais sejam salvos rapidamente e estejam disponíveis para análise posterior.

Distribuição do tráfego de carga de trabalho

Tenha em conta os tipos de tráfego que o seu ambiente HPC gera e processa. Esta etapa é especialmente importante se você planeja executar vários tipos de cargas de trabalho e planeja usar o armazenamento para outros fins. Considere e registre os seguintes tipos de tráfego:

  • Fluxo único versus vários fluxos
  • Proporção entre tráfego de leitura e tráfego de gravação
  • Tamanhos e contagens médias de ficheiros
  • Padrões de acesso aleatórios versus sequenciais

Localidade dos dados

A próxima categoria leva em conta a localização dos dados. O reconhecimento de localidade ajuda a determinar se você pode usar cópia, cache ou sincronização como sua estratégia de movimentação de dados. A seguir estão os itens de localidade a serem verificados previamente:

  • Dados de origem no local, no Azure ou em ambos?
  • Dados de resultados no local, no Azure ou em ambos?
  • Cargas de trabalho HPC no Azure a serem coordenadas com cronogramas de modificação de dados de origem?
  • Dados sensíveis/HIPAA?

Requisitos de desempenho

Os requisitos de desempenho para soluções de armazenamento geralmente são resumidos da seguinte forma:

  • Taxa de transferência de fluxo único (em Gb/ps)
  • Taxa de transferência multifluxo (em Gb/ps)
  • IOPS máxima esperada
  • Latência média (ms)

Cada consideração afeta o desempenho, então esses números representam um guia que uma determinada solução deve alcançar. Por exemplo, você pode ter uma carga de trabalho HPC que faz criação e exclusão extensiva de arquivos como parte do fluxo de trabalho. Essas operações podem afetar a taxa de transferência geral.

Métodos de acesso

Considere o protocolo de acesso para cliente necessário e seja claro sobre quais recursos do protocolo você precisa. Existem diferentes versões de NFS e SMB.

Eis alguns pontos a ter em consideração:

  • Versões NFS/SMB necessárias
  • Recursos de protocolo esperados (ACLs, criptografia)
  • Solução de sistema de arquivos paralelo

Necessidade de capacidade total

A capacidade de armazenamento no Azure é a próxima consideração. Ajuda a informar o custo global da solução. Se você planeja armazenar uma grande quantidade de dados por um longo tempo, convém considerar a hierarquização como parte da solução de armazenamento. A hierarquização oferece opções de armazenamento de baixo custo combinadas com armazenamento de custo mais alto, mas de maior desempenho, em um nível quente. Portanto, avalie os requisitos de capacidade da seguinte forma:

  • Capacidade total necessária
  • Capacidade total de hot-tier necessária
  • Capacidade total de aquecimento necessária
  • Capacidade total do nível frio necessária

Método de autenticação e autorização

Em relação aos requisitos de autenticação e autorização, como o uso de um servidor LDAP ou ambiente do Ative Directory, garante que você inclua os sistemas de suporte apropriados para a arquitetura. Se você precisar oferecer suporte a recursos como mapeamento UID/GID para usuários do Ative Directory, confirme se a solução de armazenamento oferece suporte a esse recurso.

Eis alguns pontos a ter em consideração:

  • Local (UID/GID apenas no servidor de ficheiros)
  • Diretório (LDAP, Ative Directory)
  • Mapeamento UID/GID para usuários do Ative Directory?

Comparação de soluções de armazenamento comuns do Azure

Categoria Armazenamento de Blobs do Azure Ficheiros do Azure Azure Managed Lustre Azure NetApp Files
Casos de utilização O Armazenamento de Blobs do Azure é mais adequado para cargas de trabalho de acesso sequencial de grande escala e leitura pesada em que os dados são ingeridos uma vez com poucas ou nenhuma modificação adicional.

O Blob Storage oferece o menor custo total de propriedade, se houver pouca ou nenhuma manutenção.

Alguns exemplos de cenários são: dados analíticos em larga escala, computação de alto desempenho sensível à taxa de transferência, backup e arquivamento, condução autônoma, renderização de mídia ou sequenciamento genômico.
O Azure Files é um serviço altamente disponível mais adequado para cargas de trabalho de acesso aleatório.

Para compartilhamentos NFS, o Azure Files fornece suporte completo ao sistema de arquivos POSIX. Você pode usá-lo facilmente a partir de plataformas de contêiner, como a Instância de Contêiner do Azure (ACI) e o Serviço Kubernetes do Azure (AKS) com o driver CSI interno e plataformas baseadas em VM.

Alguns cenários de exemplo são: arquivos compartilhados, bancos de dados, diretórios base, aplicativos tradicionais, ERP, CMS, NAS migrações que não exigem gerenciamento avançado e aplicativos personalizados que exigem armazenamento de arquivos em expansão.
O Azure Managed Lustre é um sistema de ficheiros paralelo totalmente gerido mais adequado para cargas de trabalho HPC de média a grande dimensão.

Permite aplicativos HPC na nuvem sem interromper a compatibilidade de aplicativos, fornecendo funcionalidade, comportamentos e desempenho familiares do sistema de arquivos paralelo Lustre, garantindo investimentos em aplicativos de longo prazo.
Serviço de arquivos totalmente gerenciado na nuvem, alimentado pela NetApp, com recursos avançados de gerenciamento.

O NetApp Files é adequado para cargas de trabalho que exigem acesso aleatório e fornece amplo suporte a protocolos e recursos de proteção de dados.

Alguns cenários de exemplo são: migração de NAS empresarial local que requer recursos avançados de gerenciamento, cargas de trabalho sensíveis à latência como SAP HANA, computação de alto desempenho sensível à latência ou IOPS intensiva ou cargas de trabalho que exigem acesso simultâneo a vários protocolos.
Protocolos disponíveis NFS 3,0

DESCANSO

Armazenamento do Data Lake Ger2
PME

NFS 4,1

(Sem interoperabilidade entre ambos os protocolos)
Brilho NFS 3.0 e 4.1

SMB
Funcionalidades principais Integrado com cache HPC para cargas de trabalho de baixa latência.

Gerenciamento integrado, incluindo ciclo de vida, blobs imutáveis, failover de dados e índice de metadados.
Zonalmente redundante para alta disponibilidade.

Latência consistente de milissegundos de um dígito.

Desempenho e custo previsíveis que se adaptam à capacidade.
Alta capacidade de armazenamento de até 2,5 PB.

Baixa latência (~2ms).

Gire novos clusters em minutos.

Suporta cargas de trabalho em contêineres com AKS.
Latência extremamente baixa (tão baixa quanto sub-ms).

Recursos avançados de gerenciamento ONTAP da NetApp, como o SnapMirror na nuvem.

Experiência consistente de nuvem híbrida.
Desempenho (Por volume) Até 20.000 IOPS, até 100 GiB/s de taxa de transferência. Até 100.000 IOPS, até 80 GiB/s de taxa de transferência. Até 100.000 IOPS, até 500 GiB/s de taxa de transferência. Até 460.000 IOPS, até 36 GiB/s de taxa de transferência.
Preços Preços do Armazenamento de Blobs do Azure Preços dos Arquivos do Azure Preços do Azure Managed Lustre Preços dos Arquivos NetApp do Azure

Roll-your-own sistema de arquivos paralelo

Assim como o NFS, você pode criar um sistema de arquivos BeeGFS ou Lustre com vários nós. O desempenho de tais sistemas depende em grande parte do tipo de Máquinas Virtuais selecionadas. Você pode usar imagens encontradas no Azure Marketplace para BeeGFS ou uma implementação do Lustre por DDN chamada Whamcloud. O uso de imagens de terceiros de fornecedores como BeeGFS ou DDN permite que você adquira o suporte deles. Caso contrário, você pode usar o BeeGFS e o Lustre por meio de suas licenças GPL sem outros encargos (além das máquinas e discos). Essas ferramentas são fáceis de implantar usando os scripts HPC do Azure com discos locais efêmeros (para rascunho) ou SSD Premium/Ultra para armazenamento persistente.

Cray ClusterStor

Um dos maiores desafios com cargas de trabalho maiores é replicar o desempenho puro "bare-metal" de grandes clusters de computação trabalhando ao lado de grandes ambientes Lustre (em termos de taxa de transferência TB/s e, possivelmente, Petabytes de armazenamento). Agora você pode executar essas cargas de trabalho com a solução Azure Cray ClusterStor. Essa abordagem é uma implantação pura do Lustre bare-metal colocada no data center relevante do Azure. Sistemas de arquivos paralelos como BeeGFS e Lustre oferecem o mais alto desempenho devido à sua arquitetura. Mas essa arquitetura vem com um alto preço de gestão, assim como o uso dessas tecnologias.

Próximos passos

Os artigos a seguir fornecem orientação sobre cada etapa da jornada de adoção da nuvem para ambientes HPC de fabricação.