自社が保管するデータが将来どんな高い価値をもたらすか、データ量はどれだけ増加し負荷になるか。予測が非常に難しくなっている今、データ保管のリスクを最小限にするための考え方を紹介します。
“Don't spend a dollar to save a dime. (10セントを節約するために1ドルを費やすな)”とは、的を射た名言です。しかし、今日の10セントが将来大金になる可能性があるなら、話はもっと複雑になります。
数十年にもわたるデータの保管とリスク管理を計画する場合、まさにこれが課題となります。データの価値は、時がたつにつれて変化することがあり、場合によっては劇的に変化します。データの規模についても同様です。50PBのアーカイブが、数年で300PB以上になる場合もあります。データアーカイブの規模が拡大するにつれ、コストと煩雑さが増大していきます。
あるデータの将来的な価値を事前に知ることは困難です。単に歴史的な意義しか持たなくなるのか。二度と参照されないのか。あるいは、最近増えてきているAI の進化によって価値あるビジネスインテリジェンスとなるのか…。
データが、直近でビジネス価値を持つ場合には、すべてのデータをオンライン上に保管しておくこともできます。一方、長期間で考えると、データによってその価値があるものと、ないものがあります。予言者でもなければ、価値の有無についてあらかじめ知ることは困難でしょう。
基本的な方程式
X =データの将来的な潜在価値
Y =データの維持コスト
データが企業の全体価値にとって有益であるためには、X > Yである必要があります。この場合、データは企業経営に貢献しています。
Y >X である場合には、データが負担となって、企業経営に悪影響を及ぼしています。仮にY >3X にもなれば、深刻な問題が発生します。
ギャンブラーの選択
実際には将来の「X」の値を予見することはできないため、現実的な選択肢は次の2つとなります。
- すべてのデータを永続的に保管する
- ( 短期的または長期的に)明確な価値がないデータを取り除く
オプション2は、場合によってはうまくいくかもしれませんが・・・