昨今話題になっているビッグデータ。元々はテクノロジーの世界で使われていた言葉が、広く一般にも使われるようになった数少ないキーワードの一つです。
ビッグデータの定義と本コラムにおけるフォーカス・ポイント
ビッグデータは既に様々な企業が定義しています。一番ポピュラーなのは、「3つのV」です。
これはVolume(大量のデータを蓄積・処理)、Velocity(高速・リアルタイムな処理・伝送)、Variety(多種多様なデータ)という3つのVから始まるキーワードで定義づけをするものですが、これはあくまでビッグデータの「データとしての特性」を表現するもので、ビッグデータの一面を表しているに過ぎません。
なお、④のBUSINSSに関しては、業種・業務によって様々なデータの活用方法が考えられますが、類型化すると以下の図のような10の活用シーンに整理することができます。こうして見ると、企業活動のほとんど全ての業務・機能に活用が広がりつつあると言っても過言ではないようです。
最近のビッグデータへの注目の高まりを背景に、多くのお客様から、自社におけるビッグデータ活用の可能性について相談を受けることが多くなってきました。
ただし、実際にはお客様側の事前検討が十分に進んでいないことも多く、本格的な実行フェーズに進めないことが多いというのが実態です。
原因としては、ビジネス活用の目的や解決したい課題が明確化していないパターンがほとんどです。
その意味では、まだまだ多くのお客様でビッグデータ活用の機運が十分に高まっていないのではないかと推察せざるを得ません。ただし、これだけビッグデータが話題になると、目的の設定が不十分なまま「我が社でも何かしなければ!」という焦燥感にかられるというのも致し方ありませんし、経営トップから「当社でビッグデータ活用は何かできないのか!」という指示が落ちてくるというのもよくある話です。
CTCは、そのようなお客様に対して、データ分析で解決したいビジネス課題を明確化するようなご支援も行っていますが、本コラムでは、ある程度課題が明確化されているという前提で、どのようにデータを活用するか、という方法論、つまり上記の4つの要素のうちの②TECHNOLOGYと③KNOWLEGEに絞って話しを進めて行きます。
ビッグデータを活用するための技術
一口にビッグデータに関するTechnologyといっても、データの収集・加工、蓄積、分析・活用までが対象範囲となるため、含まれる技術要素も多岐に渡ります。
中でも、ビッグデータを蓄積するためのデータベース技術の進化は目覚しいものがあります。データベース技術を大別すると、いわゆる構造化データに強い従来型のリレーショナルデータベース(RDBMS)と非構造化データの格納・処理に強いHadoop/NoSQLデータベースに分けられます。
今後はHadoop/NoSQLデータベースがRDBMSを代替するのかというと、そうではなく、データの種類や処理等の要件によってRDBMSとの共存・併用が進んでいくものと思われますが、残念ながら国内においてはSI企業もお客様側もHadoop/NoSQLに対する知識やスキルが十分とは言えません。
次回は、Hadoopの技術について解説します。
著者紹介
クロスファンクショングループ
ITビジネス企画推進室
ビジネス開発部
エグゼクティブエンジニア
保木 富雄