[AIM319] Build, manage, and scale ML development with a web-based visual interface(AI/ML)
投稿日: 2022/12/09

Amazon SageMaker Studioは、データサイエンスと機械学習(ML)のための統合開発環境(IDE)です。
このセッションでは、SageMaker Studioを使用してデータを準備し、Webベースの単一のビジュアルインターフェイスでMLモデルを構築、トレーニング、展開、管理する方法について説明しました。
ML開発のための包括的なツールセットにアクセスする方法と、SageMaker Studioを離れずにステップをすばやく切り替える方法について学びました。

Agendaは次のとおりです。
- SageMaker Studioの概要
- JPMorgan ChaseのSageMaker Studioの旅
- 新しいSageMaker Studioの機能
- デモ

Amazon SageMaker StudioはML用のユニバーサルIDEです。データの準備、特徴量の保存、バイアス検出、ノートブックでビルド、パラメータの調整、本番環境での展開、予測の説明、管理、監視の範囲が含まれます。データサイエンティスト、MLエンジニア、データエンジニアはSageMaker Studioを使用できます。

OmniAIは、データサイエンティストとMLエンジニアがクラウド規模の機械学習モデルを迅速かつ簡単に構築し、モデル学習・展開まで可能なJPMorgan Chaseの完全管理プラットフォームサービスです。

JPMorgan ChaseがStudioを有効にする方法は次のとおりです。
[アクセス]
- OmniAIのUI使用:学習とJPMorgan Chase内のプラットフォームサービス
- カスタムSDK
[Security]
- 事前署名されたURL(有効期限、ソースIP)の有効性
- VPCモード
- EFS暗号化
- ダウンロードボタン無効化
- Egress コントロール

Studioで利用可能なSageMakerの機能は次のとおりです。
- Data Wrangler:ML用のデータ収集と準備
- Pyspark processing jobs:Pythonベースのビルド、BYOR Spark
- Feature store: 特徴量の保存、カタログ化、検索、再利用
- Autopilot: 完全な可視性を備えたMLモデルの自動生成
- Experiments: チーム間のモデル成果物の追跡、視覚化、共有
- Debugger and profiler: 学習実行のデバッグとプロファイリング
- Clarify:偏向検出と予測の理解
- Pipelines:ワークフロー自動化、ML用CI / CD、コアモデルカタログ
- Model monitoring : デプロイされたモデルの精度を維持

SageMakerの新しいアップデートは次のとおりです。
- Studio UIが新しく改編されました。左側のタブで使用したいStudioの機能をさらに見つけやすくするように変更したり、メインページのUIなどに対して変更されました。
- データの準備が簡素化されました。
- サーバーレスでデータ準備が可能になりました。一例として、SageMaker Notebookコードを使用してデータを準備できます。
- リアルタイムコラボレーションが可能になりました。
- ノートブックコードを本番準備ジョブに自動的に変換します。
JPMorgan Chaseのケースでは、OmniAIについて知ることができました。また、今後SageMakerにどのような機能が追加され、どのような点が変わるのかを教えてくれて有用なセッションでした。