Introdução

Concluído

Neste módulo, discutiremos dois sistemas de arquivos distribuídos: o HDFS (Sistema de Arquivos Distribuído Hadoop) e o Ceph FS. O HDFS e o Ceph FS foram projetados para serem sistemas de arquivos de Big Data, porém têm diferenças sutis. O HDFS foi projetado para arquivos grandes com semântica de gravação única e muitas leituras. O Ceph FS, por outro lado, é voltado para ser um sistema de arquivos distribuído de uso geral que pode ser usado para uma variedade de aplicativos implantados em um cluster virtualizado. O Ceph FS é um sistema de arquivos que está em camadas sobre um repositório de objetos distribuído. Este módulo detalhará algumas das opções de design feitas pelos desenvolvedores desses sistemas de arquivos para aplicativos de destino.

Objetivos de aprendizagem

Neste módulo, você vai:

  • Examinar as metas de design e as características de arquitetura do HDFS (sistema de arquivos distribuído Hadoop).
  • Examinar as metas de design e as características de arquitetura do Ceph FS (sistema de arquivos Ceph).
  • Comparar e contrastar o HDFS e o sistema de arquivos Ceph.

Pré-requisitos

  • Entender o que é a computação em nuvem, incluindo os modelos de serviço de nuvem e os provedores de nuvem comuns.
  • Conhecer as tecnologias que habilitam a computação em nuvem.
  • Entender como os provedores de serviços de nuvem pagam e cobram pela nuvem.
  • Saber o que são os datacenters e por que eles existem.
  • Saber como os datacenters são configurados, alimentados e provisionados.
  • Entender como os recursos de nuvem são provisionados e medidos.
  • Estar familiarizado com o conceito de virtualização.
  • Saber quais são os diferentes tipos de virtualização.
  • Entender a virtualização de CPU.
  • Entender a virtualização de memória.
  • Entender a virtualização de E/S.
  • Conhecer os diferentes tipos de dados e como eles são armazenados.