2012/05/09

SpiderOak が予想外の部分で素晴らしかった件

先日、Dropbox から SpiderOak に乗り換えることに決定(以前の記事)し、本日やっと自宅と会社のPCで SpiderOak の同期設定を行った。

自宅PCに SpiderOak を導入したときから、なにやら気持ち悪い違和感があったのだが、実はそれこそが SpiderOak のあまり語られていない(?)魅力だと言うことを知ったので、ご紹介。

気持ち悪い違和感というのは、SpiderOak にバックアップされるデータ容量が、ローカルフォルダの容量と比較して少なすぎたことでした。

先に結論

SpiderOak では、重複しているファイルがあった場合、重複分の容量は無駄に確保しないようになっているため、ストレージ容量を効率的に使うことができる。


SpiderOak の特徴として、何よりもセキュリティ面について述べている記事を多く目にするが、特徴はそれだけではなかった。

例えば、500MB のファイルがあったとして、これを10個コピーしてバックアップしたとする。これで合計容量は 5000MB ≒ 5GB となる。しかし、ファイル名や格納先が異なっていても、中身は同一なので SpiderOak 上では 500MB しか確保されない。

SpiderOak 上には 500MB しか確保されていなくとも、そこからローカルに全てのファイルをダウンロードすると、そこには 5GB 分のファイルが復元される。わお。素晴らしい!

さらに、データがアップロードされる際には圧縮もされているので、バックアップする内容によっては大幅に容量を削減できる。

以下、経緯など。

SpiderOak の導入環境

Dropbox から移行するにあたり、もしも SpiderOak の使い勝手がよくない場合にはすぐに Dropbox に戻せるように、Dropbox のフォルダをそのまま SpiderOak の同期対象にすることにした(ただし、Dropboxフォルダ内の「.dropbox.cache」というフォルダと一部フォルダを対象外にしている)。

同期の設定は、はっきりいって分かりづらい。Dropbox と同じ感覚で使おうとするとつまづくと思われる。これはまた別の記事に書く。→書きました

データ容量の比較

SpiderOak でのバックアップが終わった時点で、SpiderOak では、以下のように表示されていた。

左側に見える、Home~Desktop というのが自宅PCでバックアップした Dropbox フォルダの容量、その下が会社のPCでバックアップした Dropbox フォルダの容量。それぞれ、1.058GB176.35MB と表示されている。同期しているので、同じ容量が表示されないのは気持ち悪いが、差分の容量だけ表示されているらしい。画面下の合計容量を見ると、1.235GB となっている。

この時点で猛烈に違和感が。そんなにデータが少ないはずがない。



そして、Dropbox でバックアップされている容量を確認すると 2.4GB となっている。

ローカルの容量も確認してみると以下の通り。

Dropbox フォルダ全体で 3.28GB あり、キャッシュフォルダには 911MB あるので、差し引くと、

3.28GB – ( 911MB / 1024 ) = 2.39GB

となり、Dropbox でバックアップされている容量と一致する。やっぱり少ない。バックアップしきれていないんだろうか?

SpiderOak からバックアップをダウンロードしてみる

きちんとバックアップできているのか不安で仕方がないので、一度 SpiderOak からバックアップをまるっと落としてみることにした。

自宅PCと会社PCの同期設定は済んでいるので、ここは容量が少なく表示(176.35MB)されている会社のDropboxフォルダを自宅PCへダウンロードしてみることにした。

手順は

  1. SpiderOak アプリの「View」から Dropbox フォルダを選択してダウンロードボタンをクリック

  2. ダウンロード場所を選択してOKクリック

  3. ダウンロードマネージャが表示されるので、終わるのを待つ

ダウンロードマネージャの表示を見ると、そこには 2.493GB の表示。

あれ、SpiderOak にバックアップされている容量は合計で 1.235GB なのに、ダウンロードされる容量は正しそう。

ダウンロード完了後のフォルダを見てみると、容量が合っている。

重複防止機能

いったいどういうことか分からない。ということで調べてみても、日本語でそれらしい情報が出てこないので、おとなしく公式情報を漁ったら普通に書いてあった。

その中に、以下のように書かれている。

10-15 Times Faster Data Upload

  • Greatly reduce backup & sync time through comprehensive compression and advanced de-duplication (saving you time)
  • You are only charged for the compressed de-duplicated data amount (saving you money)




内容はこんな感じ?

アップロードが10~15倍も速い!(何と比較してかは分からないが)

  • データは圧縮するし、重複してるデータは無駄にアップロードしないし、とにかくバックアップと同期の時間を大幅に短縮するよ(あなたの時間を節約するよ)
  • (ローカルにある実データ量ではなく) 圧縮されて重複排除されたあとのデータ量に対してだけのお支払いでOKだよ(あなたのお金も節約するよ!)




上記内容で全て納得。これって、もっともっとアピール出来るポイントだと思うんだけど、あまり情報がないですね。日本語の情報がないだけなのかな。

SpiderOak は、とにかく無駄を省いて容量を削減 (データ圧縮と重複排除) して、ユーザには削減した容量分だけストレージを使っていることを正直に伝えている、ということらしい。

対して Dropbox では、実データと同じ容量のストレージを消費しているように見える。でも調べてみると、実際にはDropbox も重複防止機能を使っているらしい。ユーザに対しては重複した分の、実際に使っていない容量も使っているように見せているようだ。

重複データをどこまで排除するか

重複データを保持しないという話で思い出すのが、Bitcasa。

若干古い記事だけど、最近の「つかってみた」系の記事では、あまり重複ファイルについて触れられていないので。

要するに、誰かが自分と同じファイルをアップロードしていたら、サーバ側では1ファイル分のデータだけ保持しておいて、みんなに同じファイルを参照させるよ、と。Dropbox もこの方法でストレージ容量を削減している(便宜上ファイルと書いたが、実際はデータブロック単位)。

しかし、SpiderOak では、プライバシー上の問題もあることから、それをしないという主張をしている。つまり、他人と全く同じデータをアップロードしても、それは別のデータとして扱われる(自分がすでにアップロードしているデータを複製した場合にのみ、重複防止機能が働いて、無駄な容量は削減される)。

WikiPediaのオンラインストレージの項目 を見ると、今や数多くのサービスが乱立しているのが分かる。競合が多いということは、ユーザ数獲得のためのコスト削減や利便性の向上の競争が過熱するということでもある。すべてのユーザのデータを元にして重複を排除する方式では、コスト面でも、ユーザの利便性(アップロード時間の短縮)の面でも非常に効果があるのは納得できるが、プライバシー面やセキュリティ面、ファイル競合の危険性の面から考えると、それが最良かどうかは疑問が残る。

実際、Dropboxが過去に起こした事故では全てのデータが閲覧可能になっていたらしい。他人のデータと自分のデータが同じであると判断できるということは、つまり全てのデータを丸裸にする手段を Dropbox が有しているよということなのかもしれない。

ということで、

セキュリティもプライバシーも安心!ストレージ容量も無駄に消費されない! あなたも今すぐ SpiderOak をお試しください!

あなたも私もお得!1GBのボーナス適用で最初から3GB使いたい方や、この記事が役に立ったと思われた方は こちらの紹介リンク からご登録くださいませ。

9 件のコメント:

  1. SpiderOak レビュー記事ありがとうございます!

    いろいろと検証してる中で、このページを見つけました

    拝読料として、リンクから登録させて頂いたので
    容量アップでお返ししますw

    ありがとうございました!

    返信削除
    返信
    1. コメント頂きありがとうございます。
      また、紹介リンクもご利用頂いて本当にありがとうございます。

      当記事内でもリンクしていますが、もうひとつSpiderOakの記事を書いています。そちらのコメントに記載しているのですが、現在はSpiderOakとDropboxを併用しております。

      SpiderOakが遅い・重いと感じるような場合には、参考にしてみてくださいませ。

      削除
  2. 司馬 健太郎2014年5月17日 6:35

    非常に参考になりました。
    私も、拝読量として、リンクから登録させていただきました。

    返信削除
    返信
    1. コメント&紹介リンクのご利用ありがとうございます。
      若干古い記事ですので、現状と合わない部分もあったかもしれませんが
      お役に立てましたら幸いです。

      削除
  3. もともとdropboxユーザーではなかったのですが、セキュリティを保持しながら使えるストレージを探していたところ、SpiderOakをしり、ここに来ました。

    セキュリティに気を使うなら使わないのが一番ですけどね^^

    紹介の記事、参考にさせて頂きました。また紹介リンクから登録させて頂きました。

    返信削除
    返信
    1. コメントありがとうございます。
      また紹介リンクご利用のご連絡もありがとうございます!

      セキュリティに関しては考え始めると難しいですよね。
      そもそも外部のサービスを使う時点でリスクがある、と考えることも出来ますし、かといってバックアップ先は外部でないと、いざというときに役に立たないこともあるでしょうし。。

      コメントを頂いたのを契機に、最近のオンラインストレージ事情がどうなっているのか気になってきましたので、調べてみようと思いはじめました。
      SpiderOakについても機能追加などされているのかあまり気にしていなかったので調べてみたいと思います♪

      削除
  4. SpiderOakの存在を知り、検索の結果たどり着きました。
    大変参考になる情報でしたので紹介リンクから登録させていただきました。

    ただ、住所録をCSV出力したデータをアップロードしてiPhoneでダウンロード
    してみたところ、iPhone上では内容が文字化けして判読不能でした。
    残念です。。。

    返信削除
    返信
    1. コメント&紹介リンクのご利用ありがとうございます。
      iPhoneでは利用していなかったので、早速アプリを入れてみました。

      iPhone上ではテキストファイルの編集は出来ず、閲覧だけのようですね。
      Shift-JISだと駄目なのかな?と思って試しましたが、UTF-8でも駄目でした。

      ファイルを開いてから、右上のアイコンをタップして、
      他のテキストエディタで開けば、文字化けせずに内容の確認はできました。

      ただ、それでは根本解決にはならないので、サポートに不具合として
      フィードバックしました。解決されるといいのですが^^;

      削除
  5. 私も本日、登録させていただきました。
    丁寧なご説明ありがとうございます。

    返信削除