vSphere4のデデュープ機能について知りたい
Vmware Data Recoveryで開発環境をバックアップし始めたのですが、デデュープ機能というのがありまして、
確かにVmware Data Recoveryの主要コンポーネントとして主張していますね。
デデュープ機能をもったバックアップという話は2007年ごろからあったのですが、私の周りに具体的な物として
存在していなかったので、触れる機会もなかった訳ですが、今回やっと触れてみることができました。
Vmware社のドキュメントを読んでもなかなか具体的かつ技術的な説明を見つけられませんでした。
簡単にいえば、重複データをバックアップ対象としないことにより、バックアップリソース(DISK容量や時間)を削減
する仕組みのことらしいです。
さて検証です。
同じゲストOSを2回バックアップすることにより、どれだけバックアップリソース(DISK容量や時間)を削減できたかを
見てみたいと思います。
上の図は、バックアップを取得するゲストOSのディクス構成を大まかに示しています。
具体的には
ドライブ | 容量 | 空き | 使用量 | 用途 |
---|---|---|---|---|
Cドライブ | 40GB | 20GB | 20GB | OS領域 |
Dドライブ | 10GB | 9GB | 1GB | APP領域 |
Eドライブ | 20GB | 14GB | 6GB | DB領域 |
Fドライブ | 30GB | 25GB | 5GB | その他 |
となっています。これをDiskToDisk(iSCSI)でバックアップします。
以下はバックアップを実行したときのログです。約45分程度かかっています。
さて、これを翌日やるとどうなるかですが、以下のようになりました。
約4分で終了しました。
ただ、どこまでこのサーバが頻繁に使用され、ファイルが更新されているかという問題はあるにしても、すごいなと思います。
まだ運用し始めたばかりなので、これから運用で困ったことがでてきたらレポートしたいと思います。