データ重複除去の概要

適用対象: Windows Server 2022、Windows Server 2019、Windows Server 2016、Azure Stack HCI バージョン 21H2 および 20H2

データ重複除去とは何ですか。

データ重複除去は、省略して "重複除去" とも呼ばれ、冗長なデータによる記憶域コストへの影響を軽減するために役立つ機能です。 有効にすると、データ重複除去により、ボリューム上の重複している部分が検索され、ボリューム上のデータが検査されて、ボリューム上の空き領域が最適化されます。 ボリューム上のデータセットの重複する部分は、1 回だけ保存され、さらに節減するために (必要に応じて) 圧縮されます。 データ重複除去では、データの忠実性や完全性を損なうことなく冗長性を最適化します。 データ重複除去のしくみの詳細については、「データ重複除去のしくみ」 セクション (「データ重複除去とは」ページ) を参照してください。

重要

KB4025334 には、重要な信頼性の修正を含む、データ重複除去に関する修正プログラムのロールアップが含まれており、Windows Server 2016 および Windows Server 2019 でデータ重複除去を使用する場合は、それをインストールすることを強く推奨します。

データ重複除去はなぜ有用ですか。

記憶域管理者はデータ重複除去を使用して、重複データに関連するコストを削減できます。 大規模なデータセットには大量の重複が存在することが多く、データを格納するコストを増しています。 次に例を示します。

  • ユーザー ファイル共有は同じ、または類似するファイルのコピーを多く含むことがあります。
  • 仮想化ゲストは VM 間でほぼ同じであることがあります。
  • 毎日のバックアップ スナップショットの内容は、わずかな違いであることがあります。

データ重複除去から得られる領域の節約は、データセットや、ボリューム上のワークロードに依存します。 重複の多いデータセットでは、最大 95% の最適化率、つまり記憶域使用率が 20 分の 1 になることがあります。 以下の表は、各種コンテンツに対して重複除去を行った場合の標準的な削減効果を示しています。

シナリオ コンテンツ 標準的な削減効果
ユーザー ドキュメント Office ドキュメント、写真、ミュージック、ビデオなど 30 ~ 50%
展開共有 ソフトウェア バイナリ、cab ファイル、シンボルなど 70 ~ 80%
仮想化ライブラリ ISO、仮想ハード ディスク ファイルなど 80 ~ 95%
一般的なファイル共有 上記のすべて 50 ~ 60%

注意

ボリュームの空き領域を増やすだけの場合は、クラウドの階層化が有効化された Azure File Sync を使用することを検討してください。 これにより、最も頻繁にアクセスされるファイルをローカルにキャッシュし、最もアクセス頻度の低いファイルをクラウドに階層化することで、パフォーマンスを維持しながらローカル記憶域を節約できます。 詳細については、「Azure File Sync のデプロイの計画」を参照してください。

データ重複除去はどのような場合に使用できますか。

シナリオの図 説明
Illustration of file servers. 汎用ファイル サーバー: 汎用ファイル サーバーは、次に示す任意の種類の共有を含む可能性のある一般的な用途のファイル サーバーです。汎用ファイル サーバーでは、同じファイルの多くのコピーまたはバージョンを複数のユーザーが所有する傾向があるため、データ重複除去の有力候補です。 ソフトウェア開発用の共有は、多くのバイナリがビルドごとに基本的に変更されていないため、データ重複除去の恩恵を受けることになります。
Illustration of VDI servers. 仮想デスクトップ インフラストラクチャ (VDI) の展開: リモート デスクトップ サービスなどの VDI サーバーは、組織がユーザーにデスクトップをプロビジョニングするための軽量のオプションになります。 組織がこのようなテクノロジに頼る理由はさまざまです。
  • アプリケーションの展開: 社内全体にアプリケーションをすばやく展開できます。 これは、頻繁に更新されるアプリケーション、使用頻度の低いアプリケーション、または管理しにくいアプリケーションがあるときに特に便利です。
  • アプリケーションの統合: 一連の集中管理された仮想マシンからアプリケーションをインストールして実行すると、クライアント コンピューターでアプリケーションを更新する必要がなくなります。 このオプションで、アプリケーションにアクセスするために必要なネットワーク帯域幅の量も減少します。
  • リモート アクセス: ユーザーは自宅のコンピューター、キオスク、処理能力の低いハードウェア、Windows 以外のオペレーティング システムなどのデバイスからエンタープライズ アプリケーションにアクセスできます。
  • ブランチ オフィス アクセス: VDI 展開は一元化されたデータ ストアにアクセスする必要のあるブランチ オフィスの作業者に対してアプリケーションのパフォーマンスを向上させることができます。 データ負荷の高いアプリケーションは、低速な接続用に最適化されたクライアント/サーバー プロトコルに対応していないことがあります。
VDI 展開では、ユーザー用にリモート デスクトップを駆動する仮想ハード ディスクが実質的に同じであるためデータ重複除去の有力候補です。 さらに、データ重複除去は、いわゆる「VDI ブート ストーム」を軽減できます。VDI ブート ストームとは、多くのユーザーが 1 日の始まりに同時に自分のデスクトップにログオンして記憶域のパフォーマンスが低下する状況です。
Illustration of backup applications. 仮想化されたバックアップ アプリケーションなどのバックアップ先: バックアップ スナップショット間には大幅な重複があるため、Microsoft Data Protection Manager (DPM) などのバックアップ アプリケーションはデータ重複除去の有力候補です。
Illustration of other workloads. その他のワークロード: その他のワークロードもデータ重複除去の有力候補になります