このウェブサイトはクッキーを使用しています。このサイトを使用することにより、プライバシーポリシーに同意したことになります。

日本
市場トレンド

IoT/AI時代の研究開発データ活用で期待される「オブジェクトストレージ」のメリットとは

ストレージの新たなアーキテクチャとして注目されるオブジェクトストレージ。従来のファイルストレージなどと比べて、膨大なデータの活用において費用対効果が高いといわれています。特に大容量のデータを無限に拡張できる特性は、急速に増え続けるデータを用いて分析を行う企業の研究開発部門(R&D)や学術研究機関、医療機関などにも広く活用されています。なぜそうした用途に適しているのか、その特徴を見ていきます。

膨大な実験・研究データを効率的に保管・活用できる仕組みが必要

学術分野でも日々膨大なデジタルデータが生成され、実験や研究に活用されています。その最たる例が生命科学分野で、例えば遺伝子研究では人間の膨大なゲノム情報を蓄積・保管し、スーパーコンピュータなどを用いて解析を試みています。そのデータ量は、数10ペタバイトクラス、またはそれ以上になることも少なくありません。また、例えば宇宙科学での観測データ・衛星データや気象学における気象データなども、扱うデジタルデータ量は膨大なものになります。

一般企業でも同様で、現在各社がしのぎを削る自動運転車の開発では、センサーデータや自動車がとらえた画像・動画データなどの膨大なデータを収集。また、医療機関の医用画像データ、製薬会社の創薬研究開発データ、製造業における新製品開発に伴う大量の設計データなど、大容量データの取り扱いはさまざまなところで課題になります。

このように、膨大なデータ保管が必要な研究開発領域では、それに適した大容量のストレージ基盤が必要で、それは今後の増大に耐えられるよう拡張可能なものでなければなりません。研究に関する機微情報であることを考えると、クラウドストレージへの保存はプライバシーポリシーの面で難しいこともあるでしょう。

「オブジェクトストレージ」が適している理由とは

そうした背景から、研究機関にとってオンプレミスで構築可能かつ膨大な実験、研究データに対応できる拡張性の高いオンプレミスのオブジェクトストレージが注目されています。高性能なサーバーと高速なストレージ環境による解析とはまた別に、こうした解析に用いるデータのアーカイブやバックアップなど、解析に付随する用途ですでに活用されています。

オブジェクトストレージは、データを「ファイル」という単位でなく「オブジェクト」という単位で保存する仕組みを持ち、ディレクトリのような階層構造はなくデータ同士がフラットな単一の空間に保存されます。保存データの数 に制約がなく、サーバーの増設で保存容量の拡張を簡単に行うことができるため、大容量データ保管に適しています。またデータは一般的に、複数のノード(サーバー)に分散されて保存されるため、冗長性が高い点も特長です。(詳細は「近年注目される新たなデータ基盤、オブジェクトストレージとは?」を参照)

なお、研究機関におけるデータ保管では、アーカイブ用途として容量単価で高いメリットがある最新のテープストレージが活用されています。過去から現在に渡る長期的なデータ分析が必要なシーンも多いため、他の記録媒体よりも長期保管に優れているLTOテープが選ばれています。このような長期保管のニーズを満たしつつ、かつ拡張性に優れたデータ保管を実現する仕組みが今後期待されます。

これまで「死蔵」されていた非構造化データを容易に活用するための基盤となる

先に少し触れたオブジェクトストレージのような大容量データ保存の基盤が注目されているもう一つの理由は、分析データの保管への有効性です。データサイエンスが脚光を浴びる中で、データ分析は研究機関はもちろん、いまや一般企業にも重要な課題です。日々の企業活動からは、膨大な量のデータを得ることができ、いままではその多くが活用しきれないまま死蔵されていたり、あるいはデータとして記録もされないまま捨てられたりしていました。

しかし近年では、機械学習、人工知能(AI)といった技術で、従来の常識を越える大量のデータから新たな知見を見出すことが可能になりつつあります。また、IoT技術はさまざまな環境に置かれた膨大なデバイスから情報をオンラインで取得し、活用できるようにしてくれます。これらを組み合わせることで、企業の新規ビジネス開発や研究開発部門にも今まで扱えなかったような大量のデータを活用するチャンスが生まれてきているのです。

IoTデータの活用は現在、主に製造業や小売業界などで注目されています。まだIoTデータを業務可視化にしか活かせていない企業が多いですが、これからは、IoTデータを製品開発のためのデータとして活用する例も出てくるかもしれません。

このとき注目すべきは、分析に供するデータが従来のテクノロジーで扱ってきたものとは大きく異なる点です。全体的に量が多いこともさることながら、特にAIの分析対象は、リレーショナルデータベースに代表される「構造化データ」だけではなく、テキストや画像、音声、動画など多種多様なデータが想定されます。従来のデータベースでは管理できないこのようなデータは一般的に「非構造化データ」と呼ばれます。オブジェクトストレージは、大量の非構造化データの活用に最適なアーキテクチャを持っています。IoTデバイスから得られるデータも、各種センサーデータやログ、位置情報など多彩なものが含まれ、従来のデータベースでは管理しにくい非構造化データの例です。

事前のサイジングが難しい新事業では拡張が容易なオブジェクトストレージが有利

オブジェクトストレージの代表格とされるのは「Amazon S3」、すなわちクラウドサービスですが、オンプレミス環境向けのストレージ製品もあります。オブジェクトストレージ製品としては、汎用サーバーにインストールして利用するソフトウェア製品や、そこにハードウェアを組み合わせた状態で出荷されるアプライアンス製品を選ぶことが可能です。また、他のクラウド事業者も同様のサービスを提供しており、その選択肢はかなり幅広いと言えるでしょう。

この多彩な選択肢の中から選定する際に重要なポイントの一つが、「データの置き場所」です。研究開発に伴う実験のデータなど、重要なデータを社外で保管することに抵抗を持つ企業は少なくありません。先に触れた製造業などでは、工場などで生成したデータの保管にはクラウドはまだ一般的ではなく不安に思う企業も少なくないでしょう。

また、IoTなどの新しい技術は、今後どこまで活用が広がるか予想しづらく、ときとしてデータ量が膨大なものになることも考えられます。つまり事前のデータ予測が難しく、オンプレミスでのストレージの導入を考えようとするとサイジングが難しいという課題があります。従来型のストレージではデータ拡張時の手間やコストが高くついてしまう可能性もあるでしょう。その点からも、増加に合わせて拡張が容易なオブジェクトストレージがやはり役に立つのです。なお。オブジェクトストレージは、先述の通り専用のストレージアプライアンスではなく、汎用サーバーにインストールして利用することが可能なので、既設のサーバーを利用してスモールスタートで導入を進めるというメリットもあります。

複数の拠点を持つ企業でもデータをオンプレミスの単一箇所で管理できる

グローバルに拠点を抱える企業の場合、国や地域を超えて膨大なデータをやり取りしますが、そこには、新製品の研究開発に関わるものなど重要機密データも含まれるでしょう。その際にもオブジェクトストレージが共通のデータ保管の基盤となることができます。

複数の拠点を持つ企業の場合、拠点ごとにファイルサーバーが乱立してしまうことが少なくありません。それを解決する単純な方法としては、クラウドストレージの採用があります。しかし、クラウドストレージでは、企業によってはデータ保管場所のポリシーに抵触したり、また従量課金という特性上、頻繁かつ大量のデータ転送が発生する場合には思わぬコストがかかったりする可能性もあります。

そこで、自社で契約しているデータセンター内にオブジェクトストレージを導入し、そのオブジェクトストレージ内のデータを、ファイルサーバー感覚で利用できるようにするゲートウェイ製品を各拠点に導入することで、どの拠点からも同じファイルシステムに簡単にアクセスして簡単にファイル共有できるようになります。

複数の拠点からオンプレミスの単一のオブジェクトストレージへファイルサーバー感覚で利用することも可能

オブジェクトストレージは、データをオブジェクトという単位で管理していることはすでに紹介しました。そのオブジェクトは、複数のノード(サーバー)に分散配置することでデータ消失のリスクを回避していますが、その分散配置は1箇所のデータセンター内でも、地理的に離れた複数のデータセンター内で行うことも可能です。国外の企業の事例ですが、実際にこれを応用して、製品開発のためのデータを複数のデータセンターで同期して管理している例も出ています。

上記では、オンプレミスにおけるクラウドストレージの可能性を紹介しましたが、もちろんクラウドの有用性は高く、現実的には多くの企業が必要に応じてクラウドとオンプレミスを使い分けるハイブリッドクラウドの構成を取っています。オブジェクトストレージについても、クラウドベンダーが提供するものを利用するケースもあれば、自社が契約するパブリッククラウドまたはオンプレミスにオブジェクトストレージソフトウェアを導入するなど幅広い選択肢があります。いずれにせよ特定のプラットフォームに依存せず、さまざまな使用方法が可能になるソリューションとして注目を集めています。