FSV #48 Amandaバックアップ・プロジェクトとコマーシャル版のZmanda

from Silicon Valleyティザー画像

米国企業IT戦略レポート~フロム・シリコンバレー

森 洋一(テクノロジーリサーチャー)

シリコンバレー在住の森洋一氏による、米国企業を中心としたITビジネスとテクノロジー戦略の最新レポート。オープンソース、マイクロソフト、エンタープライズといったテーマについて現地の視点から考察していきます。

今回は、バックアップシステムAmandaと、それをサポートする企業Zmandaについて。


オープンソースのAmandaバックアップ・プロジェクトは、メリーランド大学で1991年から始まった。Amandaはネットワーク・ベースのバックアップ・ユティリティーとして、高価な商用パッケージ並みとまでは行かないが、Unix/Linux/BSDやMac、Windowsを対象に十分代用品として機能する。AmandaはUnix系にはdump/restoretarを用い、WindowsにはSambaのsmbtarを利用して、ネットワーク上の対象システムからバックアップを取得する。

Amandaのバックアップの採り方

実際のバックアップの採り方を見てみよう。

Amandaはネットワーク上の指定されたクライアントやサーバーから特定のバックアップ・サーバーにバックアップ・データを取り込むが、この際、日々のバックアップの総量を最小限にするため、分割バックアップと差分バックアップの組み合わせ方式を採用。下図の例ではフル・バックアップ・サイクルを4日とし、日々の想定される変化率を15%としている。事例の最初の3日間は初期期間(Startup Period)、4日目以降が定期バックアップ・サイクル(Regular Backup Cycle)となる。Amandaは4日のサイクルが指定されるとファイル全体を4分割する。

下図では、説明上、分割した部分を色分け(薄い緑、紫、茶、青)した。まず初期期間の1日目は全体の1/4にあたる緑部分を分割バックアップとして採取し、2日目は次の1/4の紫部分と前日採った緑部分の想定変更となる15%の差分を採る。3日目は茶部分の1/4と、前日採取(紫部分)の差分15%、そして最初に採った緑部分のその後の差分をバックアップする。この3日目となる緑部分は15~30%の範囲(後述)となるが、どの程度2日目から3日目の間で更新がオーバーラップしているかによって、その量が変わる。4日目からは正常なスケジュールとなり、日々全体の1/4ずつが分割バックアップされ、他に各々の部分の変化差分が適量ずつ採取される。

Amandaバックアップ採取の仕組み。
Amandaバックアップ採取の仕組み。

もう少し詳しく見てみよう。

4日間、データベースが一様に15%の変化があると仮定すると、1日目は1/4にあたる緑部分がバックアップされ、2日目はその1/4の15%、3日目は計算上27.75%(30%-15%×15%)となる。これは、もし2日目と3日目の変更部分が何もオーバーラップしていなければ最大の30%(15%+15%)となるが、2日目に採取された15%の部分にも同様に15%の変更があったとする方が一般的であるので、最大値の30%からこの重複差分(15%の15%)を引いた値が平均値と考えられる。4日目も同様に計算すると、最大値は45%(15%×3)となるが、平均値はこの最大値から前日までの差分27.75%の15%となる4.16%を引いた40.84%(45%-27.75%×15%)となる。

これはあくまで緑色の部分だけを見て単純化したものだが、実際には、他の部分も同様に変化するのでもっと複雑である。Amandaはこのような多段階の差分処理を行うことによって、バックアップ・ストレージの容量を最小化する。

さて一般的に行われる1週間単位のバックアップではどうなるであろうか。

この場合は全体のファイルは7分割され、日々は1/7ずつの分割ファイルと各々の差分がバックアップとなる。これらの作業は自動スケジューリングで運用されるが、そのためのパラメータには(1)バックアップされるデータの全体量、(2)好ましいフル・バックアップ・サイクルの間隔日数、(3)日々のデータ変化率などが必要となる。

コマーシャル版のZmanda

Amandaバックアップ・システムをサポートする会社が登場した。

Zmanda(設立2006年、本社サンタクララ)は全世界で50,000件のアクティブ・ダウンロードを誇るAmandaのAmanda Community EditionAmanda Enterprise Eeditionを提供している。無償のコミュニティ版にはドキュメントやWiki、Forumが用意され、マルチ・プラットフォーム(Unix/Linux/BSD、Mac、Windows)で稼働するクライアントやサーバーからネットワークを介してディスクやテープ、オプティカル・デバイスにバックアップを採取する。有償サブスクリプションのEnterprise EditionはAmandaを機能拡張したコンソール機能を持ち、コミュニティ版の機能に加えて、上位ミドルウェアのMicrosoft ExchangeやMicrosoft SQL Serverからのバックアップ、さらにそれらをオンライン・ストレージのAmazon S3に保存することもできる。

Amanda Enterprise Edition概念図 提供:Zmanda。
Amanda Enterprise Edition概念図 提供:Zmanda

昨年9月末、同社からオープンソース・データベースとして最も普及しているMySQL対応のZmanda Recovery Manager(ZRM) for MySQLがリリースされた。ZRMはプラグイン・アーキテクチャーを採用して、MySQLの管理者とZmandaコンソールを結び、SQL文をベースとするロジカル・バックアップや生データのロウ・バックアップ、MySQLサーバーを停止させることなく実行するホット/ウォーム・バックアップ、スナップショット・バックアップなど多様な処理を提供する。

今年1月のサン・マイクロシステムズによるMySQL買収後、3月、サンとZmandaは共同でMySQL対応の市場拡販を発表。このアナウンスによって、4月1日以降、MySQL EnterpriseユーザーはZmandaの30日間の試用とその後、気に入れば世界中のサンから直接購入できるようになった。

MySQL対応のZmandコンソールによるスケジュール管理 提供:Zmanda。
MySQL対応のZmandコンソールによるスケジュール管理 提供:Zmanda

利用にあたっての年間サブスクリプションには、サポート回数や問い合わせ方法などのサービス内容により、ベーシック/スタンダード/プレミアムの3タイプがある。ベーシックでは対象となるクライアント機(Linux/Solaris/Mac)とバックアップを採るサーバー機(含む1クライアント)用が各々年間100ドル(ただしWindowsクライアントは150ドル)、スタンダードは250ドル(同Windowsは300ドル)、プレミアムは350ドル(同Windowsは450ドル)となっている。またMicrosoft ExchangeとMicrosoft SQL Serverのバックアップはベーシックが各々300ドル、スタンダードは同600ドル、プレミアムは同800ドル。MySQL用はベーシックが300ドル、スタンダードは500ドル、プレミアムは750ドルとなって、SQL Serverに比べやや割安である。

ストレージのバックアップ業界ではこれまでSymantecが買収したVeritas NetBackup/Backup ExecやEMCが買収したLegato NetWorkerが主力であった。ZmandaのCEOチャンダー・カント(Chander Kant)氏はこれらの事情を熟知した元Veritas社幹部である。その彼は何としてもAmandaを業界有数の製品に押し上げることを狙っている。同氏によれば、Web2.0ブームやWeb関連アプリケーションなどでMySQLの使用サイトが急増し、MySQL向けバックアップの問い合わせは引きも切らないと説明する。日本市場ではNihon TechnologyAccutechsが取り扱っている。


◆ 「米国企業IT戦略レポート~フロム・シリコンバレー」バックナンバー ◆

森 洋一(もり よういち)
森洋一ポートレート写真IAF Software, Inc. Partner。米国シリコンバレー在住。明治大学卒。日本ユニシス入社後、金融機関向けリアルタイムシステムの設計と開発、流通マーケティング/オープンシステムマーケティングなどに携わる。2002年に退社。シリコンバレーにオフィスを開設し、テクノロジーリサーチャー/コンサルタントとして活動。著書に『オープンシステム・ウォーズ』『シリコンバレーからのメッセージ』(ともにオーム社)があるほか、雑誌、新聞などにも数多く寄稿。株式会社インプレスR&D シニア・アナリスト。