简介
在本模块中,我们讨论两个分布式文件系统:Hadoop 分布式文件系统 (HDFS) 和 Ceph FS。 HDFS 和 Ceph FS 都设计为大数据文件系统,但具有细微的差别。 HDFS 设计为用于具有一次写入、多次读取语义的大文件。 另一方面,Ceph FS 旨在成为一种常规用途分布式文件系统,可用于部署在虚拟化群集上的各种应用程序。 Ceph FS 是一种在分布式对象存储上进行分层的文件系统。 本模块模块详细说明了这些文件系统的开发人员为其目标应用程序所做的一些设计选择。
学习目标
在本模块中,你将:
- 回顾 Hadoop 分布式文件系统 (HDFS) 的设计目标和体系结构特征。
- 回顾 Ceph 文件系统 (Ceph FS) 的设计目标和体系结构特征。
- 比较和对比 HDFS 和 Ceph 文件系统。
先决条件
- 了解什么是云计算,包括云服务模型和常见云提供商。
- 了解支持云计算的技术。
- 了解云服务提供商如何为云付费和计费。
- 了解什么是数据中心及其存在原因。
- 了解如何设置、支持和预配数据中心。
- 了解如何预配云资源以及如何按流量计费。
- 熟悉虚拟化的概念。
- 了解不同类型的虚拟化。
- 了解 CPU 虚拟化。
- 了解内存虚拟化。
- 了解 I/O 虚拟化。
- 了解不同类型的数据及其存储方式。