ソリューション

InfluxDB

更新

大量の時系列データを蓄積・活用するために最適化された専用データベース
日本で初めて、高可用性と水平方向のスケーラビリティを実現する製品版を提供開始

時系列DBが必要なわけ

時系列データは時間の経過とともに発生するデータですが、時にIoTにおけるセンサーからデータは、ミリ秒単位で発生する高頻度のデータとなり得ます。その場合、一つ一つのデータは小さくとも、蓄積すると大容量になり、取り扱いが難しくなっていきます。
大容量データをストレスなく扱うため、一般的に時系列データに求められる機能は以下のようなものになります。

時系列DBに求められる要素

① 高速性

  • いつでもほしいデータを快適に取り出せる

② 圧縮

  • 大容量のデータをコンパクトに収納できる

③ 利便性

  • 複数のデータを一元的に管理できる
  • 簡単に状況を可視化できる

時系列DBであるInfluxDBはこういった要望を実現するための機能がそなわっています。
以下、一つ一つの特長についてご説明します。

InfluxDBの特徴

① 高速性

まず高速性についてです。こちらはInfluxDBとNoSQLの書き込み性能について比較したものになります。1秒間に処理ができる値を示したものになり、NoSQLと比較してInfluxDBの方が多くの処理が実施できています。

書き込み性能

100ホストから24時間データロードを実施
1秒間に処理できる値

書き込み性能

出典:InfluxData社 Benchmarking InfluxDB vs. Cassandra for Time Series Data, Metrics & Management

続いて読み込み性能に関してです。100個のホストをグループ化し、1時間ごとのデータをランダムに1000件抜き出す処理を1秒間に何件行えるかで比較したのがこのグラフになります。こちらについてもInfluxDBの方がNoSQLを上回る結果となっています。

読み込み性能

100ホストをグループ化し、1時間のデータをランダムに1000件抜き出す
1秒間に処理できる値の数

読み込み性能

出典:InfluxData社 Benchmarking InfluxDB vs. Cassandra for Time Series Data, Metrics & Management

② 圧縮

続いて圧縮性能に関するグラフです。
100個のホストから取り込んだ24時間分のデータを圧縮させた際の結果です。こちらもInfluxDBの方がより圧縮を効かせることができていることがご確認いただけると思います。

圧縮

100ホストから24時間のデータ(実データ87.3MBをロードした際に必要となるDisk容量

圧縮

③ 利便性

InfluxDBのダッシュボードのイメージになります。GUIでの簡単な操作でDB内のデータを可視化することができます。

InfluxDBのダッシュボードのイメージ

時系列データ活用のための統合プラットフォーム

InfluxDBは時系列データを活用するための統合プラットフォームです。
データを蓄積、データ可視化の機能の他に、データ収集のための機能、集計・演算のための機能も備わっています。データ収集のためのTelegrafには200以上のデータソースに対応したプラグインが提供されています。

InfluxDBプラットフォーム

開発会社

  • このページについてツイッターでツイート(新しいウィンドウで開く)
  • このページをフェイスブックでシェア(新しいウィンドウで開く)

このソリューションに関するお問い合わせはこちら

※記載内容は掲載当時のものであり、変更されている場合がございます。