データ統合とAI活用を実現する次世代データ基盤により、あらゆる組織の「データとAIの民主化」を支援
「データ統合」+「データ分析」+「AI/BI活用」の全てを実現するSaaS型統合データ分析基盤
組織内に点在するデータの統合や利活用、分析やAI活用や、データ基盤の肥大化や複雑化によって、運用効率の低下や高コストに悩んでいませんか?
データブリックスが提供する「レイクハウス・プラットフォーム」は、これらの課題解決をシングルプラットフォームで実現します。また、世界7,000社を超える導入実績から得た各ユースケースのベストプラクティスをもとに、お客様のデータエキスパートの育成もお手伝いします。
このような課題をお持ちであれば是非お声がけください!
データの利活用を促進したい
- 既存のDWH (データウェアハウス)のコストがかかりすぎる
- データの保管場所/システムがバラバラで統合できない
- リアルタイム性のあるデータを迅速に処理したい
- データのガバナンスがきいてない、品質が低い
本格的に機械学習やAIの活用に取組みたい
- 機械学習ワークフローが複雑で煩雑
- 機械学習モデルの管理ができていない
- 機械学習モデルをワンクリックで作りたい
- 因果関係を正しく理解した上で、精度をチューニングしたい
レイクハウスとは
レイクハウスとは、データレイクの柔軟性、経済性、スケーラビリティとデータウェアハウスのデータ管理やACID※トランザクションの機能を取り入れたオープンなデータ管理アーキテクチャです。あらゆるデータにおけるビジネスインテリジェンス(BI)と機械学習(ML)を可能にします。
- ※ ACID:トランザクションを定義する4つの重要な特性。Atomicity(原子性)、Consistency(一貫性)、Isolation(独立性)、Durability(永続性)
レイクハウスがカバーする範囲
これまでは
これからは(データブリックスの場合)
データウェアハウスとデータレイクの最良の要素をひとつのシンプルなプラットフォームに融合させ、データ、分析、AIのあらゆるユースケースをサポートします。オープンな高信頼性データ基盤によって構築されており、あらゆる種類のデータを効率的に処理します。また、全データとクラウドプラットフォームに対して一貫したセキュリティとガバナンスを適用できます。
データブリックスの特長
シンプル
統合プラットフォームが、シンプルなデータアーキテクチャによってデータサイロをなくし、これまで分断されていた分析、データサイエンス、機械学習を統合します。さらに、レイクハウスによって複雑さとコストを解消することで、分析とAIの取り組みの成果を最大化できます。
オープン
Delta Lakeがレイクハウスのオープンな基盤となっており、データレイクのデータに信頼性と世界記録を更新するパフォーマンスをもたらします。閉鎖された独自の環境を回避し、データの共有を容易にします。
マルチクラウド
データブリックスのレイクハウスプラットフォームは、クラウド間で一貫した管理、セキュリティ、ガバナンスを提供します。データ・AIを扱う現行の取り組みのために既に導入している各クラウド用に、プロセスを再構築する必要はありません。あらゆるデータを最大限活用した新たな知見の抽出に注力できます。
「データ+AI」の民主化を加速する多彩な新機能が登場
①クラウド上にある全てのデータアセットに対しセキュリティとガバナンスを強化(Unity Catalog)
- データがどこから来たのか、誰がいつ作ったのか、時間の経過とともにどう変更されたのか、どのように使われているのか、などを可視化
②オープンな環境でのデータシェアリング
- データ連携のためのプライバシーを保った安全な環境を提供
- オープンなデータ共有のフレームワークを使用するため、組織間、ツール間、クラウドサービス間でデータの共有が可能
- Databricks Marketplaceの活用で機械学習に使うモデルデータや、ダッシュボードなどもアクセス可能なデータとなり、クイックな連携が可能
③データウェアハウス
- Databricks SQL(DB SQL)は、マルチクラウドのレイクハウスアーキテクチャによって、従来のクラウド型データウェアハウスの性能と比較しても大きなコストメリットを出すことが可能
- オープンソーススタンダードを基盤とすることでデータロックインを回避
- データレイクのみでは実現できなかった高信頼性、高品質、高性能を提供
④データエンジニアリング
- Databricks Lakehouse Platformはバッチデータやストリーミングデータの簡単取込みや変換が可能
- インフラストラクチャを自動的に管理し、信頼性の高いプロダクションワークフローを編成
- ビルトインのデータ品質テストとソフトウェア開発のベストプラクティスのサポートにより、チームの生産性を向上
⑤データストリーミング
- センサー、IoTデバイス、ソーシャルネットワーク、オンライントランザクションなどリアルタイム性が求められるストリーム処理を、連続的に追加されるテーブルとして構造化し、実行
⑥データマーケットプレイス
- レイクハウスの生きたデータをあらゆるコンピューティングプラットフォームに安全に共有するためのオープンなソリューションを提供
- データセット、MLモデル、ノートブックなどのデータプロダクトを一度構築してパッケージ化し、中央のマーケットプレイスを通じて配布が可能
- データのプライバシーを保護しながら、安全なホスト環境を通じて、あらゆるクラウド上で顧客やパートナーと簡単にコラボレーションすることが可能
関連資料、動画
①3分動画シリーズ
データブリックス・ジャパン株式会社のYouTubeチャネルにて「3分でわかるLakehouse」などを公開中です。
②漫画シリーズ
データエンジニアリング、データサイエンス、データアナリストが抱えるお悩みをわかりやすく解説しています。
③ホワイトペーパー、eBook等
Databricksを活用したデータエンジニアリング、その他調査機関のレポートなど、関連資料をご覧いただけます。
無料トライアル
Databricksの無料トライアルをご利用頂くことができます。データブリックス・ジャパン株式会社のサイトよりお申込み下さい。