TOP>コラム一覧>AWS東京リージョンで生成系AIモデルを利用するには

AWS東京リージョンで生成系AIモデルを利用するには

はじめに

2022年11月30日にOpenAI からリリースされた生成系AIモデル(人口知能チャット)サービス「ChatGPT」が、高い注目を浴びています。Azure OpenAI Serviceに興味を持たれている方も多いでしょう。

では、AWSでは何ができるのでしょうか?特にAWSの東京リージョンでは何ができて、何ができないのか?については情報が五月雨式に公開されており、追えない、整理できないという方が多いと思います。

そこで今回のコラムでは、「AWS東京リージョンで生成系AIモデルを利用するには」の情報をお届けします。

*本コラムの内容は、2023年8月時点の情報を基に作成しています。最新情報はAWSのWebページよりご確認ください。
*生成系AIモデルを利用する際の入出力データの取り扱いは、AWSサービス利用規約、モデル開発元規約や自社ルールを遵守し、細心の注意をお願いします。



AWS Japanでは2023年4月頃から、生成系AIの情報を発信し始めました。

出典:https://aws.amazon.com/jp/blogs/news/announcing-new-tools-for-building-with-generative-ai-on-aws/

AWSで生成系AIモデルを活用する方法は、大きく以下の3パターンに分類することができます。
1つずつ、解説します。

①まず、自社で生成系AIモデルをスクラッチ開発したい方向けには分散学習の仕組みや、大規模なモデル、応答に時間がかかる予測を行うために最適化された専用インスタンスがリリースされています。

専用インスタンスは、インスタンスタイプごとに利用できるリージョンが限定されています。現時点では、Traniumはバージニア北部およびオレゴンリージョン、Inferentia2はバージニア北部、オハイオ、オレゴンリージョンで利用できます。Inferentia1は、東京リージョンでも利用できます。

②「公開されている生成系AIモデルの活用・チューニング」は、当社のお客様から使いたいとのニーズが挙がるなど、よく話題になる部分です。

AWSの場合、Amazon Bedrock、Amazon SageMakerなどのサービスが該当します。

そして、これから続々と増えてくると予想されるのが、③「生成系AIを組み込んだサービスの利用」です。

現状提供されているのはAmazon CodeWhispererです。実装したい内容をコメントとして記述すると、自動で候補となるコードを出してくれることで、コーディング作業の負荷軽減を実現します。

ここからは、②「公開されている生成系AIモデルの活用・チューニング」について、さらに詳しく解説します。

Amazon Bedrock

  • Amazon Bedrockは、主要なAIのスタートアップ企業(AI21 Labs、Anthropic、Cohere、Stabilability AI)および、Amazonの基盤モデルを API 経由で利用できる、フルマネージドサービスです。
  • 現在はバージニア北部、オハイオ、オレゴンリージョンの一部ユーザー企業のみの限定プレビューとなっています。日本からの申し込みも可能ではありますが、承認されるのはもう少し先と思われます。

ここまでの内容を読んで、「なんだ日本では、現状AWS上で生成系AIは使えないじゃないか」と感じた方もいるかもしれません。しかし、東京リージョンでも、Amazon SageMakerから、Bedrockで提供されるものと同様のモデル(ただしAmazon Titanを除く)や、オープンソースの主要な生成系AIモデルを利用する方法がいくつか存在します。

Amazon SageMaker JumpStart (プレイグラウンド)

最も簡単な方法として、Amazon SageMakerのコンソール画面にある「プレイグラウンド」という機能を用いて、特定の生成系AIモデルを試すことができます。

左:テキスト生成モデル(AI21 Jurassic-2 Ultra)のプレイグラウンド画面
右:画像生成モデル(Stable Diffusion 2.1 base)のプレイグラウンド画面

注意点としては、

  • コンソールでバージニア北部、オレゴン、アイルランドのうちいずれかのリージョンを選択しておかないと、この機能は使えません。
  • 各モデルのプロンプト入力画面中に、「秘密情報や機密情報はアップロードしないでください。」という主旨の注意書きがあります。現状では、あくまでもモデルの使用感をプレビューする程度の想定であることが分かります。
  • また、現状公開されているモデルでは日本語テキストに特化したものはなく、英語に比べると出力が不安定です。対策として、プロンプト入力に「日本語で答えてください。」などと加えることで、多少は改善されます。ただし、確実な方法ではなく、改善度合いもモデルによって異なります。

Amazon SageMaker JumpStart(SageMaker Studio)

SageMaker Studio分析環境にアクセスすることで、生成系AIモデルの検索や、モデルの動かすためのサンプルノートブックの閲覧、実行が可能です。

  • こちらは東京リージョンでも利用可能です。ただし、モデルの説明やサンプルノートブックトは日本語対応しておらず、英語が中心です。
  • モデルごとに独自の利用規約、課金体系、利用できるインスタンスの制約などがある場合があるのでご注意ください。

HuggingFace Hub

その他、Amazon SageMaker JumpStartにないモデルでも、HuggingFace Hubから探せばAmazon SageMaker上で実行できます。HuggingFaceはAWSと連携していますが、生成系AIのニュースとは違うタイミングで発表されたので、お気づきになっていない方も多いと思います。

  • たとえば日本語に特化したモデルを探し、Amazon SageMakerでデプロイするためのサンプルコードを表示させることが可能です。
  • モデルによってはサンプルコードのままだと実行時にエラーが出たり、タイムアウトになってしまったりするので、その場合はコードの修正が必要です。
  • データの取り扱い、商用利用可能かどうかなどは、必ずAWSだけでなく開発元の規約にも目を通す必要があります。

お客様によっては閉域網内で生成系AIモデルを使いたいというニーズもあるかと思います。そのような場合は、商用利用な学習モデルのバイナリファイルをS3にアップロードし、S3のVPCエンドポイントを作成することで、Amazon SageMaker上でモデルを実行できるようにするという方法があります。

  • 入力したプロンプトが外部に流出するといった情報漏洩リスクを極限まで小さくすることができる点が、メリットです。
  • こちらも利用の際はAWSの規約だけでなく、開発元の規約に目を通す必要があります。

まとめ

今回のコラムでは、AWSの生成系AIサービス概要および東京リージョンで生成系AIモデルを利用する方法に関する情報をお届けしました。この領域はこれから加速度的に情報が増えることが予想されますので、今後もコラムやセミナーにてお伝えします。

AWSでのデータ活用、AI活用に関するご相談は、お気軽にCTCまでお寄せください。

CTCは、AWSのビジネス利活用に向けて、お客様のステージに合わせた幅広い構築・運用支援サービスを提供しています。
経験豊富なエンジニアが、ワンストップかつ柔軟にご支援します。
ぜひ、お気軽にお問い合わせください。

お問い合わせ

【著者プロフィール】

佐々木 紫 (ささき ゆかり)

伊藤忠テクノソリューションズ株式会社 データサイエンティスト

AI・機械学習・数理最適化をはじめとするデータ活用プロジェクトにおいて、分析者・開発者として活動。
現在は、AI・機械学習システムの社会実装に向けて、クラウドデータ活用基盤の設計・構築支援、ソリューション開発、プリセールスを担当。

佐々木 紫 (ささき ゆかり)

TOP>コラム一覧>AWS東京リージョンで生成系AIモデルを利用するには

pagetop