はじめに
このモジュールでは、Hadoop 分散ファイル システム (HDFS) と Ceph FS という 2 つの分散ファイル システムについて説明します。 HDFS と Ceph FS はどちらもビッグデータ ファイル システムとして設計されていますが、微妙な違いがあります。 HDFS は、Write-Once, Read-Many セマンティクスを使用して大きなファイル用に設計されています。 一方、Ceph FS は、仮想化されたクラスターにデプロイされたさまざまなアプリケーションで使用できる汎用分散ファイル システムとして作られています。 Ceph FS は、分散オブジェクト ストア上に階層化されたファイル システムです。 このモジュールでは、これらのファイル システムの開発者が対象アプリケーションのために用意した設計上の選択肢の一部を詳述しています。
学習の目的
このモジュールでは、次のことを行います。
- Hadoop 分散ファイル システム (HDFS) の設計目標とアーキテクチャ特性を確認します。
- Ceph ファイル システム (Ceph FS) の設計目標とアーキテクチャ特性を確認します。
- HDFS と Ceph ファイル システムを比較対照します。
前提条件
- クラウド サービス モデルや一般的なクラウド プロバイダーなど、クラウド コンピューティングの概要を理解している。
- クラウド コンピューティングを実現するテクノロジを把握している。
- クラウド サービス プロバイダーのクラウドの料金と課金について理解している。
- データセンターとは何か、それはなぜ存在するのかを把握している。
- データセンターの設定、稼働、およびプロビジョニングの方法を理解している。
- クラウド リソースのプロビジョニングと測定の方法について理解している。
- 仮想化の概念について知識がある。
- さまざまな種類の仮想化の内容について把握している。
- CPU の仮想化について理解している。
- メモリの仮想化について理解している。
- I/O の仮想化について理解している。
- さまざまな種類のデータとその格納方法について把握している。