[DAT328] [NEW LAUNCH!] Enabling operational analytics with Amazon Aurora and Amazon Redshift engines
投稿日: 2022/12/09

運用分析のために、Amazon Aurora トランザクションデータのパイプラインを 新しいZero-ETL を使用してAmazon Redshift に構築します。
リアルタイムに近い分析と機械学習を使用できる技術へのセッションでした。

Amazon Aurora から Amazon Redishift にデータパイプラインを構築するための既存のアーキテクチャとして、データエンジニアの役割が大きな状況です。

Amazon Aurora Zero-ETL機能を使用したときにデータエンジニアとして設定する必要があるパイプラインアーキテクチャの図です。

Zero-ETLの利点は、簡単かつ安全にデータパイプラインを構築し、リアルタイムに近いデータ分析を可能にします。

さらに、Zero-ETLはAurora Serverless v2とRedshift Serverlessの間にも適用できます。

Zero-ETLアーキテクチャは上の図のようになります。
- Zero-ETLは、Aurora storageからChange data capture(CDC)を使用して、データをRedshift storageにリアルタイムで近い速度で転送します。
- データに加えて自動的に監視および回復します。

Amazon Aurora Zero-ETL to Amazon Redshift は以下のとおりです。
- ペタバイト級のトランザクションデータをほぼリアルタイムで分析するためにAmazon Redshiftを使用できるように、完全に管理されたAmazon Auroraの機能
- Amazon Aurora にトランザクションデータが記録されてから数秒以内に Amazon Redshift でデータを使用可能
- トランザクションデータをほぼリアルタイムでAmazon Redshift分析とマシンランニングとして利用可能
既存のAmazon Auroraのトランザクションデータを分析するには、多くの段階のパイプライン環境を作成して転送が長くなりましたが、新しいZero-ETL機能で簡単にAmazon Redshiftにすばやく配信することで、高速なデータ分析が進行可能で効率が向上しました。