コラム

今知っておきたい!ITインフラ・テクノロジー

【第1回】Software-Defined-Storage を賢く使おう

更新

CTCの技術力を支える製品技術主管のエンジニアが、ITインフラ分野の動向や技術、活用法を中心に、様々な話題をわかりやすく紹介します。

データの多様化・大容量化に伴って、企業のデータ基盤へSoftware-Defined Storageを検討されるケースが徐々に増えています。
本コラムでは、Software-Defined Storageについて紹介するとともに、データ活用の基盤として、より賢く利用するポイントを紹介します。

1.多様性が求められるストレージとSoftware-Defined

昨今、仮想化技術やビッグデータの普及に伴い、データを保存するストレージに対する要望は、処理速度や拡張性、コスト面でのメリットなど、使用環境により重視される要件が多様化しています。

そこで、これまで専用のストレージシステムで実現してきたストレージ機能をソフトウェアで実装し、汎用IAサーバと組み合わせ、要件に合わせ柔軟にデータ基盤を提供できるSoftware-Defined Storageがでてきます。

汎用のIAサーバを使用しすることで、システムが使用するデータ量に準じてサーバ台数を調整することで容量の拡張や縮小ができます。また、処理能力の高いサーバを揃えて性能に特化したり、安価なサーバを大量に用意して大容量のストレージを構成したりすることも可能です。

2.Software-Defined Storageで覚えておくべき基本技術

Software-Defined Storageと一言で言っても様々な形態がありますが、今回はデータプレーン領域について説明します。使用するソフトウェアによってアーキテクチャは様々ですが、基本的にはストレージを構成するシステム全体で、データの分散と複製を行い、性能、可用性、信頼性などを向上させます。

2.1.データはオブジェクト

SDSでは、データをオブジェクトとして管理することが一般的です。
従来のファイルシステム管理では、ファイルとしてディレクトリ内で構造的に管理されていましたが、データにユニークなIDを割り当て、オブジェクトIDを元にフラットに管理されます。

2.2.データの分散と複製を構成する代表的なアーキテクチャ

Distribute/Replication

Distributeでは、オブジェクトをアルゴリズムに従って、物理的に異なるノードへ格納。オブジェクト自体は 分割しない。Replicationでは、オブジェクトをコピーし、ノード間で複製を保持。これらの組み合わせでスケールアウトと可用性を実現。

Distribute/Replication イメージ

Erasue Coding

オジェクトをアルゴリズムに従って、分割して消失訂正符号を付加し、物理的に異なるノードに分散して格納。分割したデータの一部が消えても消失訂正符号を元にオブジェクトのリカバリが可能。

Erasue Coding イメージ

これらの技術を用いて、複数のサーバとサーバに搭載されている複数のディスクを使用して、一つの大きなボリュームを提供するのがデータプレーンとしてのSDSの機能です。

これまで、ソフトウェアベースのストレージは、性能や信頼性の面からアーカイブやコンテンツ配信など、一部の使用に限られていました。しかし、ソフトウェアの改良などによって適用領域が広がりつつあります。

3.Softweare-Defined Storageをさらに活用する

Software-Defined Storageと一言で言っても様々な形態がありますが、今回はデータプレーン領域について説明します。使用するソフトウェアによってアーキテクチャは様々ですが、基本的にはストレージを構成するシステム全体で、データの分散と複製を行い、性能、可用性、信頼性などを向上させます。

3.1.ストレージ用途だけではもったいない

SDSはソフトウェアで実装されたストレージ機能を汎用IAサーバ上で動作させますので、 使用するソフトウェアにも依存しますが、ソフトウェアを動作させる上で、現行の高性能な汎用IAサーバではCPUリソースが余剰になったり、メモリが余剰になったりすることがあります。通常、その余剰リソースは無駄になってしまいますが、その余剰リソースを使用して、ストレージを構成するノード上で他のサービスを提供することができれば、大きなメリットとなります。

3.1.1.仮想化ホスト&ストレージ基盤

そのような機能を提供しているのが、VMwareのVSANで、専用の共有ディスクを使用せずに、各vSphereのノード上に搭載されているSSD、ディスクを一つのデータストアとして構成し、データストアを形成するノード上で仮想マシンを稼動させるvSphere環境のための仕組みです。

同様に、VSAN以外でもハイパーバイザーとの同一のホストで稼動できるソフトウェアストレージや、複数のホストのディスクを共有ストレージとして提供できる仕組みがあれば、ストレージ機能を提供するホスト上の余剰リソースを使用して、共有ディスクレスの仮想化基盤を構成することが可能です。

データストアと仮想基盤

データストアと仮想基盤

3.1.2.データ集積&データ分析基盤

仮想化のみならず、アプリケーションなどサービスと組み合わせた使い方も可能です。
様々な機器のログなど非構造データを集積するストレージ基盤上にデータ分析のアプリケーションを稼動できた場合、ストレージがそのままビックデータ解析のシステムとなりえます。

データ集積とデータ分析基盤

データ集積とデータ分析基盤

これによって、機器削減のコストメリットのほか、解析ソフトが集積されたデータにアクセスするための方法を自身が提供できることで、分析対象のデータの移動・配布時間なども軽減することができます。

4.Softweare-Defined Storage活用を阻害するのは情報不足

SDSでは柔軟な構成を取れる反面、使用するソフトウェアや機器の構成によって機能や性能も大きく変わります。特に、アプリケーションとストレージを同じシステム上に構成するためには、各ソフトウェアストレージがどれくらいのリソースを必要とするのか、どれくらいの余剰リソースが見込めるのか、ソフトウェアストレージのサイジング指標や、機能などの特性を把握しておく必要があります。

CTCでは、ソフトウェアストレージソリューションであるCustom Oreder Storageをリリースし、新しいストレージ利用の形を安心してご提供できるよう、様々なSoftware-Defined Storageのノウハウを蓄積していっています。

次回以降のSDS関連のコラムでは、もう少し上記のような構成を実現させるための具体例に踏み込んでお送りしたいと思います。

著者紹介

製品・保守事業推進本部 ITインフラ技術推進第1部 プラットフォーム技術推進課 藤澤 好民

製品・保守事業推進本部 ITインフラ技術推進第1部
プラットフォーム技術推進課
藤澤 好民

  • このページについてツイッターでツイート(新しいウィンドウで開く)
  • このページをフェイスブックでシェア(新しいウィンドウで開く)

このコラムに関するお問い合わせはこちら

※記載内容は掲載当時のものであり、変更されている場合がございます。