大艦巨砲主義芸術のアトリエ

なんかちょっと外した写真技術とかITだったり手芸だったり

データアーカイビングとBlu-ray Discの(割といいかもしんない)カンケイ

しばらく前に「BD-Rを企業のアーカイブストレージに」って話があったんで語ってみようと思う。

アーカイブってナニよ?

ITシステムのデータって、OSとかアプリとかのコード類まで含めると、だいたいはシステムの運用、維持に使われるんだけど、そのほかにも法的に保存の必要なデータ、ってのもある。例えば、法で保存期間の決められているものもあるし…

japan.cnet.com

あと、訴訟とかの対策のためにとっときたいデータ、ってのもあるね。事件が起こって、それが自社/従業員が関与してないことを証明するためのデータとして、システムのログだったり、メールデータのアーカイブなんかもできるだけとっときたい。
そういうのが「アーカイブ」だと思ってください。

バックアップとは違うの?

割と紛らわしいのでまとめてみたよ!

  • アーカイブ:継続的に取っておく必要のあるデータ
    →できるだけ長期間(20~30年,下手すっと永久に?)保存が必要。
    →急ぎで参照することは少ない。
    →システムの運用/維持には必要ない(つまりオンラインでなくていい)

  • バックアップ:ストレージがトんだ時に戻す元のデータ
    →大昔のデータは残ってなくていい。だいたい5世代くらいあればいい。
    →そこそこ早く参照できるとありがたい。*1
    →システムの運用/維持に必要。

アーカイブに最適なメディアって?

じゃあ、何に保存しましょう?ちょっと条件を挙げてみるよ。

  1. 長期保存できるべし。
  2. 長期間経過しても読み出せるべし。
  3. 保存中にコストがかかるべからず。

1と2、同じじゃね?と思われるかもしれませんが、そこの種明かしは後ほど。
3については、具体的には「スペースを取らないこと(小型だったり、容量効率がよかったり)」とか「電力食わないこと」とかになる。できるだけ小さくて、保存中に電気流す必要がないものが最強ってわけね。

具体的にはどんなメディア?…ガチでアウトなやつからいきましょうか。

ダメなんです、こいつら。
HDDは、回ってないとグリスが固まるんでたまに回して(=電気を通して)やる必要があります。*2
フラッシュメモリも、構造的に電気流すことでデータがリフレッシュされる仕組みなので、電気流さないと データが消えます*3

磁気テープの(意外な?)弱点

じゃ磁気テープは?ってことになりますが。

磁気テープは自体は、中のデータを30年保存できるとしています。 fujifilm.jp

データ用でなくて映像用ですが、2014年に1965年のテープが再生できた事例があります。すなわち…約50年。よくね?よくね? www.nhk.or.jp んが、上の事例は同時に磁気テープの弱点も示しているのです。それは

かける機械 (ドライブ) が死んだら再生できない

当たり前じゃん、って?それでは今コンピュータ用磁気テープの主流であるLTOのサポートライフサイクルを見てみましょう。

  • LTO1ドライブ: (生産終了)
  • LTO2ドライブ: (生産終了)
  • LTO3ドライブ: LTO1, LTO2, LTO3テープの再生に対応
  • LTO4ドライブ: LTO2, LTO3, LTO4テープの再生に対応
    (以下略)

LTO1テープでいっぱいデータを蓄積していた人は、LTO3ドライブが生産終了しちゃったら…しかも上位規格への保存しなおしをする予算もなかったら?

LTO3ドライブの生産が継続されるよう、神様仏様HPE様IBM様に祈りを捧げるしかないのです。*4

そこでBlu-rayですよ?

だいぶ前になりますが、パナソニックから「Blu-ray Disc(BD-R)をデータ保存メディアとするアーカイブストレージ」が発表されました。

panasonic.biz

これ、はてブでは割と「Blu-rayかよw」的な反応だったのですが、

  • 長期保存できるべし。: 加速試験で50年保存可能であることが実証済み
  • 保存中にコストがかかるべからず。: 保存中は電力を消費しない

と、最低ラインはクリアしてます。ちょっと意外。

光ディスクの(意外な?)利点

実はBlu-rayって

  • 長期間経過しても読み出せるべし。

についてもアドバンテージがあるのでした。

いや、だってさ、
Blu-rayってCDも再生できる
んですよ?…当たり前じゃん、と思ったでしょ?CDが生まれたのは1982年*530年前です。30年前の規格を再生できて、後継規格が現行で存在するメディアってないでしょ?

実際のところ、どうなん、これ?

で、このデータアーカイバ装置なんですが、 http://panasonic.biz/archiver/lb-dm9/index.htmlpanasonic.biz まあ、一番多そう用途は「XaaS*6業者が従量制アーカイビングサービスを提供する際のインフラ」じゃないかなーと思います。ノリ的にはAWSのGlacierとか、Google Cloud Storage Nearlineみたいな。プロバイダー的にも、人件費や電気代が必要なのは格納/取り出しの時だけであとはほっとけるので「保存するだけなら安いけど、データアクセスは別料金」ってビジネスプランは丁度いい感じ。

パーソナルユースは…ねえ…。デスクトップでも使えてUSB接続、なんてのもあるそうですが panasonic.biz お値段、どこにも出てませんでしたwwww おそらく目ん玉飛び出るお値段になるかと思われます。

ということで、個人のデータアーカイビングは、当面はBD-R(BD-XL)でちまちまとっかえひっかえやるか、ハードディスクに格納して腹をくくるか、しかないようです。

*1:曖昧な言い方だけど、「お値段とご相談」って意味な。

*2:ちょっとこのへんエヴィデンスっつーか具体的なデータがなかった。

*3:こっちもエヴィデンスが…。「消えちゃった」って人は多いと思うけど。

*4:実際のところ、2016年2月現在はLTO3ドライブはまだ新品が手に入ります。案外、3の倍数世代(3,6,9…)だけは生産が継続されるんじゃねえかなあ、なんて予想しています。

*5:1979年に規格発表、1982年にドライブ第1号が発売。

*6:なんちゃら as a Service、な。