Best Engine

ITの最新動向を紹介する技術情報サイト

コラム:経営に役立つクラウド活用

「AIをあなたの手に」GoogleTMはAIを民主化する

3年前、DeepMindによって開発されたコンピュータ囲碁プログラムが、トッププロ棋士を破り、そして人間のプロ棋士との対局から引退した。このニュースは大きく報道され、ご覧になった方は多かったのではないだろうか。
近年、大企業の研究機関を中心に人工知能(以下、AI)の活用が始まり、企業やスマホアプリでのAI活用が一般化しつつある。自社で「AIをビジネスの中で活用する」方法を模索する際に、今回紹介するGoogle が提供しているCloud AutoMLTM(以下、AutoML)が一つの手助けになる。

AIとはそもそも何か?

AIと聞いたときに、皆さんはどんなものをイメージするだろうか?
例えば、ロボットであれば人の肉体労働を代替するものとしてイメージされるように、AIは頭脳労働を代替するものとしてイメージされるのではないだろうか。そして映画の「ターミネーター2」や「マトリックス」のような全知全能のAIが、ある日自我に目覚め人間を支配するディストピア(ユートピア/理想郷の正反対の社会)を想像される方は多いのではないかと思う。

弱いAIと強いAI

しかし、必要以上にAIの活用に恐れる必要はない。
AI研究者は、意識や自我を持つか持たないかでAIを「強いAI」「弱いAI」と区別している。現在のAIはすべて、特定の目的のために人間の設計通りに動く道具としての弱いAIだ。自我を持った強いAIは、まだ現れていないどころか、どうすればできるのかもわかっていない、というのが現状だ。むしろ、恐れるべきポイントは、弱いAIが回答を導き出せるように、適切な問題設定がされているか、という点であろう。問題設定が適正かどうかは、小規模なPoC(Proof of Concept、概念実証)を繰り返すことで検証が可能だ。

Google CloudTMはAIを民主化する

GoogleはAIの活用について、2017年に行われたGoogle Cloud Next ‘17イベントの基調講演で下記の発表をしている。

GoogleのAI研究者のFei-Fei Li氏はサンフランシスコで始まった「Google Cloud Next ‘17」の基調講演で、AIクラウドの新機能などを発表した。AIはより多くの人々に利用されてはじめて、社会や経済に大きなインパクトを与えるもので、「すべての自動車が自動運転車になれば、渋滞は大幅に減少し、駐車場不足も解消し、都市を劇的に変える。AIで重要なのはスケール(規模)だ。(AIのような)テクノロジーが誰にも届けば、社会は大きく変貌する。これがAIの民主化を行い、開発者や会社やユーザのコミュニティが簡単にAIを使えるようにすべき理由だ」(訳:CTC北川)と語った。

Google Cloudは「AIの民主化」を実現するために、(1)計算能力(コンピュート)の民主化、(2)アルゴリズムの民主化、(3)データの民主化、(4)才能(タレント)の民主化という四つの民主化を進めていくという。
ここで重要なのは、AIの研究で最先端を行くGoogleが、自らAIの実現に必要な計算能力とアルゴリズムの公開を、積極的に行っていくと宣言したことだ。

Googleが提供するAI

AIの民主化の宣言に基づき、Googleは既に、

  • 画像認識の「Cloud VisionTM
  • 動画分析の「Google Cloud Video IntelligenceTM
  • 音声認識の「Cloud Speech-to-TextTM
  • 機械翻訳の「Cloud TranslateTM
  • 自然言語解析の「Cloud Natural LanguageTM
  • 強力なジョブ検索・発見ツールの「Google Cloud JobsTM

を提供している。

音声認識や画像認識のAIはAmazon Web Services(AWS)やMicrosoft Azureなども提供しているが、データ量が大きく、解析するのに大量のマシンパワーを必要とする動画認識するAIを提供するのは、Googleが初めてとなる。それぞれのAIが利用する学習モデルは、Googleが提供するものが利用できる。ユーザがこれらのAIを用いることで、音声認識や画像認識といったコンピュータによる現実環境の認識と、機械翻訳や自然言語解析による言語の解析が可能となる。画像データ、音声データのような生データから、特徴を抽出することができるようになったのだ。例えば動物の種類を認識するCloud Visionのモデルでは、犬の写真画像を評価すると、犬 80%、猫 20%、魚 0%のように判別をする。

AIをカスタマイズできるAutoML

Googleがあらかじめ用意した学習モデルで対応できないようなニーズ、例えば特定のサービスに特化した画像認識をしたい場合や、学術用語や法律用語に特化した翻訳をしたい場合がある。そういったニーズに答えるため、GoogleはAutoMLを公開した。音声認識以外の3つのAI、画像認識、機械翻訳、自然言語解析にそれぞれ対応したAutoMLが存在する。
AutoML を利用すると、AIの専門知識があまりない開発者でもビジネスニーズに合った高品質のモデルをトレーニングできる。 AutoMLでは画像認識、機械翻訳、自然言語解析のモデルをカスタマイズできる。

Figure 1 AutoMLの構成と仕組み
Figure 1 AutoMLの構成と仕組み

https://cloud.google.com/automl/?hl=ja

一般にAIの学習を行う際には、学習データの読み出し、学習データに対する教師データの読み出し、機械学習アルゴリズムの選択、進捗状態の表示といった要素をPython等のプログラミング言語で記述しなければならない。その点をAutoMLは自動化し、利用者はデータセットを用意するだけで簡単に学習が可能だ。たとえば生産ラインのカメラ画像による良品・不良品判別、監視カメラでの不審者検知、などの活用が簡単にできる。

AI活用の応用例

AIの世界では、一つの応用例でうまく動いた手法を、全く別の課題解決に使うということがよくある。例えばCloud Visionで画像を解析する手法を、音声解析に利用するなどである。カメラ画像にこだわらなくても、画像にすることができるデータならば学習させることができる。
Googleのデベロッパーアドボケイトである佐藤氏が、音声のスペクトログラム情報を用いて、台所で発生した音の判別を試している。この実験は、仮に全てセルフサービスで行えば、AutoMLの利用料はお試し価格内に収まるという。
https://medium.com/@kazunori279/automl-vision-と-raspi-でリビングのいろいろな音を認識する-a9d5d6a1a1b9

PoCで試してみることが重要

「AIをビジネスの中で活用する」方法を模索するには、PoCをやってみるのが一番だ。小規模なPoCを繰り返して早く適切な失敗を繰り返してノウハウをためることが重要だからだ。一般的にAIに関するPoCには手間と時間とコストがかかるという先入観があるが、適切な課題設定を行えば実験的なPoCが非常に安価に、セルフサービスでできてしまう。せっかくGoogleがAIを民主化し、AutoMLのような便利なツールを提供してくれているのだから、ちょっと試してみるのはいかがだろうか。

参考資料

Cloud AutoML
https://cloud.google.com/automl/?hl=ja

DeepmindのAlphaGoの紹介ページ
https://deepmind.com/research/alphago/

強いAI・弱いAI 研究者に聞く人工知能の実像
鳥海不二夫(著)

AutoML Vision と RasPi でリビングのいろいろな音を認識する
https://medium.com/@kazunori279/automl-vision-と-raspi-でリビングのいろいろな音を認識する-a9d5d6a1a1b9

著者紹介

伊藤忠テクノソリューションズ株式会社
流通・EPビジネス企画室
クラウドインテグレーションビジネス推進部

北川 暢夫

Amazon Web Services(AWS)、Google Cloud Platform(GCP)などのパブリッククラウドを使って、マルチクラウド環境を含めたシステム構築を行っている。
以下のパブリッククラウドの認定資格を保有する。
・Google Cloud Certified - Professional Cloud Architect
・AWS Certified Solution Architect - Professional
・Microsoft Certified Solutions Export : Cloud Platform and Infrastructure

※ Google、Google Cloud Platform、GCP および BigQuery は、Google LLC の商標または登録商標です。

記載内容は掲載当時の情報です。最新情報と異なる場合がありますのでご了承ください。