ソリューション

Databricks Lakehouse Platform
(データブリックス・レイクハウス・プラットフォーム)

更新
Databricks

データ統合とAI活用を実現する次世代データ基盤により、あらゆる組織の「データとAIの民主化」を支援

「データ統合」+「データ分析」+「AI/BI活用」の全てを実現するSaaS型統合データ分析基盤

組織内に点在するデータの統合や利活用、分析やAI活用や、データ基盤の肥大化や複雑化によって、運用効率の低下や高コストに悩んでいませんか?
データブリックスが提供する「レイクハウス・プラットフォーム」は、これらの課題解決をシングルプラットフォームで実現します。また、世界7,000社を超える導入実績から得た各ユースケースのベストプラクティスをもとに、お客様のデータエキスパートの育成もお手伝いします。

「Databricks Lakehouse」データ+AIの民主化実現をご支援するプラットフォーム

このような課題をお持ちであれば是非お声がけください!

データの利活用を促進したい

  • 既存のDWH (データウェアハウス)のコストがかかりすぎる
  • データの保管場所/システムがバラバラで統合できない
  • リアルタイム性のあるデータを迅速に処理したい
  • データのガバナンスがきいてない、品質が低い

本格的に機械学習やAIの活用に取組みたい

  • 機械学習ワークフローが複雑で煩雑
  • 機械学習モデルの管理ができていない
  • 機械学習モデルをワンクリックで作りたい
  • 因果関係を正しく理解した上で、精度をチューニングしたい

レイクハウスとは

レイクハウスとは、データレイクの柔軟性、経済性、スケーラビリティとデータウェアハウスのデータ管理やACIDトランザクションの機能を取り入れたオープンなデータ管理アーキテクチャです。あらゆるデータにおけるビジネスインテリジェンス(BI)と機械学習(ML)を可能にします。

  • ACID:トランザクションを定義する4つの重要な特性。Atomicity(原子性)、Consistency(一貫性)、Isolation(独立性)、Durability(永続性)

レイクハウスがカバーする範囲

これまでは

データの利活用を進めるために、これまでは様々なツールを連携し、複雑なトランザクションを処理していました。また、半構造化や非構造化データを扱う場合にはデータレイクを利用し、クラウドサービスを利用する場合には膨大なサービス群から必要なサービスを組合わせることが必要でした。これらは、データ、システム、ツールのサイロ化を引き起こし、管理者、運用者双方にとっても多様なスキルが必要となるため、本質的な分析プロジェクトを進める上でのボトルネックとなっていました。

これからは(データブリックスの場合)

データウェアハウスとデータレイクの最良の要素をひとつのシンプルなプラットフォームに融合させ、データ、分析、AIのあらゆるユースケースをサポートします。オープンな高信頼性データ基盤によって構築されており、あらゆる種類のデータを効率的に処理します。また、全データとクラウドプラットフォームに対して一貫したセキュリティとガバナンスを適用できます。

シンプルでオープンでマルチクラウドに対応する基盤

データブリックスの特長

シンプル

統合プラットフォームが、シンプルなデータアーキテクチャによってデータサイロをなくし、これまで分断されていた分析、データサイエンス、機械学習を統合します。さらに、レイクハウスによって複雑さとコストを解消することで、分析とAIの取り組みの成果を最大化できます。

オープン

Delta Lakeがレイクハウスのオープンな基盤となっており、データレイクのデータに信頼性と世界記録を更新するパフォーマンスをもたらします。閉鎖された独自の環境を回避し、データの共有を容易にします。

Original Creators

マルチクラウド

データブリックスのレイクハウスプラットフォームは、クラウド間で一貫した管理、セキュリティ、ガバナンスを提供します。データ・AIを扱う現行の取り組みのために既に導入している各クラウド用に、プロセスを再構築する必要はありません。あらゆるデータを最大限活用した新たな知見の抽出に注力できます。

「データ+AI」の民主化を加速する多彩な新機能が登場

①クラウド上にある全てのデータアセットに対しセキュリティとガバナンスを強化(Unity Catalog)

  • データがどこから来たのか、誰がいつ作ったのか、時間の経過とともにどう変更されたのか、どのように使われているのか、などを可視化

②オープンな環境でのデータシェアリング

  • データ連携のためのプライバシーを保った安全な環境を提供
  • オープンなデータ共有のフレームワークを使用するため、組織間、ツール間、クラウドサービス間でデータの共有が可能
  • Databricks Marketplaceの活用で機械学習に使うモデルデータや、ダッシュボードなどもアクセス可能なデータとなり、クイックな連携が可能
データシェアリング

③データウェアハウス

  • Databricks SQL(DB SQL)は、マルチクラウドのレイクハウスアーキテクチャによって、従来のクラウド型データウェアハウスの性能と比較しても大きなコストメリットを出すことが可能
  • オープンソーススタンダードを基盤とすることでデータロックインを回避
  • データレイクのみでは実現できなかった高信頼性、高品質、高性能を提供

④データエンジニアリング

  • Databricks Lakehouse Platformはバッチデータやストリーミングデータの簡単取込みや変換が可能
  • インフラストラクチャを自動的に管理し、信頼性の高いプロダクションワークフローを編成
  • ビルトインのデータ品質テストとソフトウェア開発のベストプラクティスのサポートにより、チームの生産性を向上

⑤データストリーミング

  • センサー、IoTデバイス、ソーシャルネットワーク、オンライントランザクションなどリアルタイム性が求められるストリーム処理を、連続的に追加されるテーブルとして構造化し、実行

⑥データマーケットプレイス

  • レイクハウスの生きたデータをあらゆるコンピューティングプラットフォームに安全に共有するためのオープンなソリューションを提供
  • データセット、MLモデル、ノートブックなどのデータプロダクトを一度構築してパッケージ化し、中央のマーケットプレイスを通じて配布が可能
  • データのプライバシーを保護しながら、安全なホスト環境を通じて、あらゆるクラウド上で顧客やパートナーと簡単にコラボレーションすることが可能

関連資料、動画

①3分動画シリーズ

データブリックス・ジャパン株式会社のYouTubeチャネルにて「3分でわかるLakehouse」などを公開中です。

データブリックス・ジャパン株式会社 - 公式チャンネル

②漫画シリーズ

データエンジニアリング、データサイエンス、データアナリストが抱えるお悩みをわかりやすく解説しています。

ブリックスちゃんがデータエンジニアリングのお悩みを「まるっと」「ずばっと」解決!

③ホワイトペーパー、eBook等

Databricksを活用したデータエンジニアリング、その他調査機関のレポートなど、関連資料をご覧いただけます。

無料トライアル

Databricksの無料トライアルをご利用頂くことができます。データブリックス・ジャパン株式会社のサイトよりお申込み下さい。

  • このページについてツイッターでツイート(新しいウィンドウで開く)
  • このページをフェイスブックでシェア(新しいウィンドウで開く)

▼ページを選ぶ

このソリューションに関するお問い合わせはこちら

※記載内容は掲載当時のものであり、変更されている場合がございます。