|特集・対談|CTC approaches Generative AI ビジネスの未来を拓く生成AIの可能性

特集・対談 02
生成AI、ChatGPT誕生の背景とその技術に迫る
生成AIはどのように進化し、ChatGPTの登場へと至ったのか。
今知っておくべきAIのテクノロジーについて、先端技術の動向調査・研究、発信を行う有馬 正行氏とAIビジネスの開発に取り組む藤澤 好民氏に聞きました。
それぞれの専門領域からAIと関わる

有馬 正行
技術戦略室
アソシエイトプリンシパル
専門領域はデータベース、ネットワークプログラミング、制御系。情報通信キャリア領域での開発に携わった後、新規ビジネスやサービスの開発に従事。2019年から現職。
- ―――
- 有馬さん、藤澤さんはそれぞれ、技術戦略の立案、サービスの企画や開発という立場で、AIに携わられてきたと伺っています。まずはお2人の、これまでのAIとの関わりについて教えてください。
- 有馬
- 私はもともと、データベースを専門領域としておりましたが、NTTドコモ様のiモードやiチャネルなどのサービス開発で、PMやアーキテクトを担当してきました。その後、「IoTトイレ」など自社サービスの企画・開発を行いましたが、AIについては既存のモデルを利用するに留まっていました。ChatGPTの発表以降、生成AIを中心に調査・研究をしています。
- 藤澤
- 私はもともとLinuxを専門に扱っていました。そこでミドルウェアやデータベースを含めて幅広くインフラ寄りの技術を見てきました。
その後、ディープラーニングが登場した時に、AI開発環境やAI運用のサービス立ち上げに携わるなど、AIには比較的早くから関わってきました。
当初は主に、AIをより良い形で動かすためにはどういう仕組みや環境があれば良いか、といったことを考えていました。その後、AIによる分析サービスの企画や開発に携わるようになりました。
生成AIの発展とChatGPTの誕生
- ―――
- ChatGPTが社会に与えた衝撃は大変なものでしたが、どのような背景から生まれたのかは、おそらくあまり知られていません。生成AI、そしてChatGPTが登場するまでにどのような流れがあったのか、教えてください。
- 有馬
- AIという概念自体は何十年も前からありましたが、現在につながるような進化は、この10年くらいの間で起きたように思います。特に大きな節目となったのは、2012年の「Googleの猫」です。AlphaGoという囲碁のソフトが最高峰の棋士に勝ったというのが2015年で、AIと人間を比較する語られ方が増えてきました。そして2017年に、ChatGPTなどのベースとなるTransformerというLLMが登場。そこからLLMが急速に発展して、2022年11月のChatGPTの公開へと至ります。
- 藤澤
- LLMは自然言語処理(NLP)で、人間の言葉をコンピュータで処理するという分野において、ディープラーニング技術を用いて作られたモデルのことです。NLPも歴史は長く、LLMもその延長線上に出てきたものだと考えると、こちらも歴史は長いと言えます。
- ―――
- なるほど。ただ、ChatGPTには、これまでのAIの進化の流れを超越したような驚きがありました。
- 有馬
- 私にとってもものすごい衝撃でした。当時、コロナ禍でZoomが普及したのを背景に、オンラインでのコミュニケーションを円滑にするためにAIのアバターによるサービスを考えていました。
そうした時にChatGPTが登場して「これはやばい」と思ったのです。それまではAIといっても対話にはシナリオがありました。基本的には、こう言ったらこう返答するという流れが決まっていた。それが、『2001年宇宙の旅』に登場するHAL9000のような、まさに自然な対話ができるAIが突如、現れたわけです。
その衝撃は、今まで30年近くITに携わってきた中で一番大きいかもしれません。以来、仕事の大きな部分を、ChatGPT関連へシフトさせてきました。

藤澤 好民
新事業創出・DX推進グループ
DXビジネス推進事業部 AIビジネス部 デシジョンインテリジェンス課長
Linux /OSSをはじめ、ミドルウェア、データベースの解析などに専門的に取り組んだ後、AIビジネスに携わる。AIの開発環境を構築するサービスから、現在は生成AIに関連するサービスの企画・開発と共にAIの最適化、自動化などを手掛ける。
- 藤澤
- 私にとってもChatGPTの衝撃はとても大きいものでしたが、生成AI自体には、だいぶ前から触れていました。
生成AIとは、データを学習することを通じて新しいコンテンツを生み出すことができるAI全般を指します。生成できるコンテンツは、画像、動画、音楽、テキスト、プログラムのコードなど多岐にわたり、その中でテキストの生成に特化したものの一つがChatGPTということになります。その生成AIの発端となったのは、敵対性生成ネットワーク(GAN:Generative Adversarial Network)という技術です。GANとは、学習データを自ら作り出す「教師なし学習」で使用されるアルゴリズムの一つで、本物のデータに近いけれど微妙に違う仮想のデータを生成することができ、AIに学習させるデータが足りない時に、データ量を稼ぐためなどに使われてきました。
そこで「生成(Generative)」という言葉が出てきたのですが、私たちも「NeuCraft」※というプロジェクトで、StyleGANを使っています。NeuCraftは、京都の朝日焼という窯元の過去作品1,000点を撮影し、画像データをAIに学習させることで、朝日焼らしさもありつつ、陶芸家が考えつかなかった新たな焼き物のデザインを生成し、作品作りのインスピレーションに使ってもらおうというプロジェクトです。市場でも、この数年で生成AIがビジネスの領域でも使える可能性が加速的に高まりました。
現在の生成AIの進化につながるTransformerが登場してから、ChatGPTへと至る流れは、有馬さんがおっしゃった通りです。ChatGPTも統計に基づくモデルだというのはわかるのですが、あのような形にするための学習データ量、チューニング技術や、言葉を自然な形でアウトプットする技術などが、明らかに今までと一線を画しています。それまでは、AIが本当にイノベーティブだったり、クリエイティブだったりすることはないというのが常識でしたが、その印象を揺るがすだけの衝撃がありました。
記載内容は掲載当時の情報です。最新情報と異なる場合がありますのでご了承ください。