データアーカイビングとBlu-ray Discの(割といいかもしんない)カンケイ
しばらく前に「BD-Rを企業のアーカイブストレージに」って話があったんで語ってみようと思う。
アーカイブってナニよ?
ITシステムのデータって、OSとかアプリとかのコード類まで含めると、だいたいはシステムの運用、維持に使われるんだけど、そのほかにも法的に保存の必要なデータ、ってのもある。例えば、法で保存期間の決められているものもあるし…
あと、訴訟とかの対策のためにとっときたいデータ、ってのもあるね。事件が起こって、それが自社/従業員が関与してないことを証明するためのデータとして、システムのログだったり、メールデータのアーカイブなんかもできるだけとっときたい。
そういうのが「アーカイブ」だと思ってください。
バックアップとは違うの?
割と紛らわしいのでまとめてみたよ!
アーカイブ:継続的に取っておく必要のあるデータ
→できるだけ長期間(20~30年,下手すっと永久に?)保存が必要。
→急ぎで参照することは少ない。
→システムの運用/維持には必要ない(つまりオンラインでなくていい)バックアップ:ストレージがトんだ時に戻す元のデータ
→大昔のデータは残ってなくていい。だいたい5世代くらいあればいい。
→そこそこ早く参照できるとありがたい。*1
→システムの運用/維持に必要。
アーカイブに最適なメディアって?
じゃあ、何に保存しましょう?ちょっと条件を挙げてみるよ。
- 長期保存できるべし。
- 長期間経過しても読み出せるべし。
- 保存中にコストがかかるべからず。
1と2、同じじゃね?と思われるかもしれませんが、そこの種明かしは後ほど。
3については、具体的には「スペースを取らないこと(小型だったり、容量効率がよかったり)」とか「電力食わないこと」とかになる。できるだけ小さくて、保存中に電気流す必要がないものが最強ってわけね。
具体的にはどんなメディア?…ガチでアウトなやつからいきましょうか。
- ハードディスク
- フラッシュメモリ(SSD、SDカード、コンパクトフラッシュ等)
ダメなんです、こいつら。
HDDは、回ってないとグリスが固まるんでたまに回して(=電気を通して)やる必要があります。*2
フラッシュメモリも、構造的に電気流すことでデータがリフレッシュされる仕組みなので、電気流さないと データが消えます。*3
磁気テープの(意外な?)弱点
じゃ磁気テープは?ってことになりますが。
磁気テープは自体は、中のデータを30年保存できるとしています。 fujifilm.jp
データ用でなくて映像用ですが、2014年に1965年のテープが再生できた事例があります。すなわち…約50年。よくね?よくね? www.nhk.or.jp んが、上の事例は同時に磁気テープの弱点も示しているのです。それは
かける機械 (ドライブ) が死んだら再生できない
当たり前じゃん、って?それでは今コンピュータ用磁気テープの主流であるLTOのサポートライフサイクルを見てみましょう。
- LTO1ドライブ: (生産終了)
- LTO2ドライブ: (生産終了)
- LTO3ドライブ: LTO1, LTO2, LTO3テープの再生に対応
- LTO4ドライブ: LTO2, LTO3, LTO4テープの再生に対応
(以下略)
LTO1テープでいっぱいデータを蓄積していた人は、LTO3ドライブが生産終了しちゃったら…しかも上位規格への保存しなおしをする予算もなかったら?
LTO3ドライブの生産が継続されるよう、神様仏様HPE様IBM様に祈りを捧げるしかないのです。*4
そこでBlu-rayですよ?
だいぶ前になりますが、パナソニックから「Blu-ray Disc(BD-R)をデータ保存メディアとするアーカイブストレージ」が発表されました。
これ、はてブでは割と「Blu-rayかよw」的な反応だったのですが、
- 長期保存できるべし。: 加速試験で50年保存可能であることが実証済み
- 保存中にコストがかかるべからず。: 保存中は電力を消費しない
と、最低ラインはクリアしてます。ちょっと意外。
光ディスクの(意外な?)利点
実はBlu-rayって
- 長期間経過しても読み出せるべし。
についてもアドバンテージがあるのでした。
いや、だってさ、
Blu-rayってCDも再生できる
んですよ?…当たり前じゃん、と思ったでしょ?CDが生まれたのは1982年*5、30年前です。30年前の規格を再生できて、後継規格が現行で存在するメディアってないでしょ?
実際のところ、どうなん、これ?
で、このデータアーカイバ装置なんですが、 http://panasonic.biz/archiver/lb-dm9/index.htmlpanasonic.biz まあ、一番多そう用途は「XaaS*6業者が従量制アーカイビングサービスを提供する際のインフラ」じゃないかなーと思います。ノリ的にはAWSのGlacierとか、Google Cloud Storage Nearlineみたいな。プロバイダー的にも、人件費や電気代が必要なのは格納/取り出しの時だけであとはほっとけるので「保存するだけなら安いけど、データアクセスは別料金」ってビジネスプランは丁度いい感じ。
パーソナルユースは…ねえ…。デスクトップでも使えてUSB接続、なんてのもあるそうですが panasonic.biz お値段、どこにも出てませんでしたwwww おそらく目ん玉飛び出るお値段になるかと思われます。
ということで、個人のデータアーカイビングは、当面はBD-R(BD-XL)でちまちまとっかえひっかえやるか、ハードディスクに格納して腹をくくるか、しかないようです。