混迷を続ける世界経済。
Meta、アマゾンをはじめとする巨大テック企業の大量解雇が大きな注目を集める中で、今、テクノロジー業界で「大きな成果が出始めた」として注目されるのが人工知能(AI)の「生成系AI」分野です。
IT批評家の尾原和啓さんは生成系AIの時代に起こるビジネスの変化について、「生成系AIによって、よりビジネスはエンジニアリングよりブリコラージュ※になる」と言います。
※ブリコラージュ:日曜大工、素人仕事。ここではそうした仕事のつぎはぎの意味
テックトレンドの最前線を俯瞰している尾原さん、そしてAI研究者でプログラマーの清水亮さんとの対話から、「生成系AI時代の2023年以降、ビジネス現場で起こること」を深掘りします。
尾原:生成系AIって、「僕たちが描いてほしい絵」を文字で書くと、望んだ絵を描いてくれますよね。
最近は「ChatGPT」みたいな形で、対話形式に質問を振ると、それに近しい答えが返ってくる時代になった。
ただ、周囲の反響を見ていると、大きな誤解もあると思っていて。
結構な人が「自分の欲しい答えが即、手に入る社会」みたいな誤解をしてる気がします。まだそんなところまで技術は進んでいない。
「生成系AI」っていうのは、確かに今世の中にないものを作ってくれるっていうことに関しては、合ってます。なんですけど、正解を返してくれるわけでは、まだないんですよね。
まずここに1個目の誤解があって。
—— ChatGPTの何がすごいのか?については12月に掲載した記事でも掘り下げました。
尾原:正解を必ずしも返してくれない中で、ビジネスや「広義のモノ作り」の何が変わるかっていうと、「AIが圧倒的な高速回転の、アイデアの壁打ち相手になる」っていうのが一つ。
あと壁打ち相手としてリバウンドしてくれるものが、一人の意識ではなくなった。いろんなところから集まった知恵によって反射が返ってくるんですね。
そうすると、ビジネスの作り方が全く変わるんです。
僕が書いた「エンジニアリングからブリコラージュになる」という話に戻ると、
エンジニアリングっていうのは、解決すべき問題を設定した時に、ある一定の成功確率の中で、実現的に再現性が取れる問題解決を作れればいい —— っていうモノづくりのメソッドです。
—— それで言うとブリコラージュはどんな?
尾原:それに対して、ブリコラージュは、「今あるものをパッチワークで繋げていくと、気づいたら全体像として全く違うものができていた」っていうモノの作り方です。
(生成系AIを相棒として使う時代には)AIっていうスーパー高速な、しかも世の中をどんどん学習しながら賢くなっていく壁打ち相手と、試行を高速にまわしながらツギハギでモノを作っていくと、今までになかったとんでもないものができるようになる ——っていう風な考え方で、捉え直した方がいいんじゃないかと。
—— 従来のモノ作りやサービス作りとは、まったく違うものになる、と。
尾原:そういう意味あいで「ビジネスは、エンジニアリングからプリコラージュになる」っていう言い方をしてるんですよね。
—— 清水さんは、この「ブリコラージュ」という話はどう感じます?
清水:尾原さんがおっしゃっている「ブリコラージュになる」っていうのは、僕はむしろ「DJになる」だと思ってるんですよ。
尾原:「DJ」という言い方もいいですね。正しいと思います。
清水:実は他媒体のコラムで「プログラマーはもういらない」って話を書こうとしてたんですよ。
なぜプログラマーである僕自身が、自分の存在を否定するようなことを言うかというと、プログラミングというのは、もはや教養になったと思ってるんです。学校教育で習ってるんですから。
再来年にはもう義務教育でプログラミングを勉強した10代が卒業する年になるわけですよね。
—— プログラミング教育が中学校で拡充されることになったのが2021年度。2024年になったら、義務教育として本格的にプログラミングを学んだ10代が社会に出てくることになります。
清水:だから、もはや教養なんです。誰もが一定程度、コードが書ける時代になったのなら、職業として「誰かのためにプログラムを書く時代はもう終わり」なんだ、と。
—— 英会話を満足に話せる日本人がまだ少ないなかで、プログラミングも「習得」レベルになりますか?
清水:最近会った20代前半の2人組の起業家の話をするとね、2人とも、従来の意味で「プログラム」は書けないんです。だけど、1人が頑張って勉強して、ノーコード※でアプリを作ってしまった。
実は、このノーコードのアプリで、実際に資金調達もできている。もちろん、アプリはカッコ良くはないかもしれないけど、別にこれでそんなに怒る人もいないだろう、というレベルにはなってます。
これってまさに「自分のために書いた」コードですよね。
ノーコード:プログラミングのソースコードを記述することなくWebアプリなどを制作できる環境・サービスのこと。非エンジニア人材でも、アプリのように動作するサービスを作ることができる。
清水:ここまでアプリを作ることが簡単になった現実がある。さらにAIの時代がきた。
AIの時代に何が変わるかというと、AI以前の世界っていうのは、「数理モデル化が難しいもの」は作れなかった。例えば自動的に絵を描くとか、音楽を作るとかです。
それが、ここ数年の技術の進展によって、数理モデルを必要とせず、AIが「見よう見まねで作れる」ようになった。
今やプログラマーは、この英知を誰かが学習してくれた事前訓練済みモデルのダウンロード一発で使える。苦労することなく、「日本のアニメ風」だったり、「実写風」だったりを使うことができてしまいます。
—— そういえば清水さんは最近、AIに漫画を描かせてますよね。
清水:別に趣味ではなくて、漫画を描く行為を自分で実践することで、 実際これからのAIを使う人たちがどういう気持ちになるのかを知りたかっただけなんですが。
それで、実際に描いてみると、これってまさしくDJだなって思ったわけです。
—— AIと漫画を書くことがどんな風にDJっぽいんですか?
清水:まずAIに、例えば「友人の映画監督に似たキャラが警察官の制服着て、敬礼している」みたいな絵を描かせようとすると。
どうやるかというと、
という感じです。これって、「ブリコラージュ」って言葉の後ろの「コラージュ」にすごく近い作業でしょ?
尾原:プログラミングが大変だった時代って、やっぱりプログラムを作ること自体にある程度コスト※がかかることがネックでした※。
※時間をかけて要件定義をし、プログラマーを雇い、何カ月〜何年もかけて開発を進めるケースも。すべては時間的・金銭的コストに跳ね返ってくる。
そのために、 「何か大きな目的」が先にあって、「その目的のために作っていこう」っていうふうに、作られていた。
—— プログラマーに動いてもらうために、まず「目的」が必要だったと。
尾原:でも、このお絵描きAIみたいな感覚で、もう勝手に「ばばばっ」とプログラムを作る世界では、その「目的」っていうものは、むしろ後から立ち上がってくるんですよ。
落合陽一さんがよく言う例えなんですけれども、例えば3分の曲を作るのに30秒で作ってくれるとすると、3分の音楽を聞いてる間に6曲作れるわけですよ。
そうすると、音楽を聴きながら「次にこんな曲が欲しいな」って複数パターンの曲をAIに作らせて、その中から1番センスが合うものを次の曲にかける —— みたいなことができる。
これって、完全に「目的」が「作曲した後」から立ち上がってきてますよね。
こんな風に、自分とその目の前にいる人を楽しませるってことだけで、物が作れる時代に変わりつつある例だと思います。
だから、AI時代のモノ作りは「DJだ」という比喩は、すごく適切だなと。
—— まさに2022年後半は、画像生成AIが複数出てきてテクノロジー業界のバズになり、会話AI(ChatGPT)まで出てきました。
深層学習などのAI技術を10年近く研究してきた清水さんから見て、AI分野で2022年に同時多発的に起こったことはどう見ますか
清水:一言でいえば、AIがある種の「収穫期に入った」。
僕がAI業界にどっぷりハマるようになったのって、2013年頃からなんですよ。
当時、手描きタブレット(「enchantMOON」)を作って、その後のテーマが、「どうしたら上手な絵が描けるようになるのか」だった。
当時、ある大企業との共同プロジェクトをしていて、プロジェクトの中で最初に作ったのは、「ディープドロー(Deep Draw)」っていう(深層学習を使った)プログラムでした。ある範囲に適当な絵を書くと、その絵と似たものを検索してくれる、というものです。
これは当時としては結構うまく動いたんだけど、使いこなすには最低限ちょっとした絵を描けなきゃいけない。結局、「どうしたら上手い絵が描けるか」という問題が残る、と思ったんです。
(絵で表現することも含めて)自分の考えを表明するという「クリエイティブな行動」に対して、もっと上手く人工知能を活用するやり方があるのでは?と。
その頃から、僕の中で「絵を描くAI」っていうのが、一つの研究テーマになったわけです。
—— 約10年前から現在まで、「生成系AI」業界の大きな動きはいつ頃に?
清水:(いろいろな成果が少しずつ出てきていましたが)2020年半ばに、テキストを生成する「GPT-3」という技術が出てきて、そこからAI業界が大きく動き始めました。
ほぼ同時期に、テキストではなく画像を生成する「Image GPT」というモデルも登場。例えば「自分の頭の画像」を上半分だけ読み込ませると、下半分が髭面だったりとか、推測して作ってくれるAIなんですが。
—— GPT-3は「テキスト生成」で、ImageGPTは兄弟みたいな技術なのに「画像生成」なんですね。
清水:そこがポイントで、この研究成果を見て、「やっぱり言葉と画像っていうのは、こんなに近いもんなんだ」と衝撃を受けました。
さらに、その何カ月か後には、OpenAIの画像生成AI「DALL・E(ダーリー)」が発表されるわけです。
—— 2020年度の動きが矢継ぎ早ですね。ここから2年後のMidjourneyやStable Diffusionにはどうつながっていくんでしょう。
清水:ここがポイントで、OpenAIは2021年にDALL・Eを発表したものの、なかなか一般公開をしなかった。
そこで、シリコンバレー在住とされるフィル・ワン(Phil Wang)という若いプログラマーが、DALL・Eが本当に発表通り動くのか、論文の「再現実装」を試みる活動をGithub上で始めてしまった。
これが、オープンソースの画像生成AI誕生につながる「LAIONプロジェクト」のきっかけです。
試行錯誤を続ける中で、当然「やっぱり学習のためのデータセットがないと」となる。そこで有志たちがデータセットを集めるプログラムを作り始めて、実際に50億枚の画像・テキストペアのデータセットを作ってしまった。
—— データセットができたら、再現実装したものに学習させれば……と。
清水:そうやって出てきたものの1つが、Midjourneyや、Stable Diffusionだと理解してます。
でも、僕から見れば、両方の起点はやっぱりLAIONプロジェクト。さらに言えば、再現実装に猛烈な情熱を持ったフィル・ワンというエンジニアがいて、その情熱に共鳴した世界中の国籍も年齢もわからない名もなきエンジニアたちが作り上げた成果だと、僕は思ってます。
—— この成立の流れは、ChatGPTにも影響していますか?
清水:いえ、技術的には、ChatGPTは関係ありません。ただ、「影響していないか」というとそうとも言い切れない。
DALL・Eを出し渋っているうちに、Stable Diffusionなどが大注目されたことで、おそらくOpenAIにも火が付いた。成果を世界に公表しないとダメだという結論になったんじゃないか、と。
なぜって、OpenAIという組織は、ChatGPTまでは基本的にデモを論文と同時公開になんてしなかったんです。
だから、ChatGPTと(LAIONプロジェクト以降の流れは)技術的には無関係だけど、ChatGPTが2022年末に登場したという「出し方」には、影響したはずです。
清水:そうした背景で、ChatGPTは論文と同時に出てきた。やっと(AI研究者以外の)一般の人たちの想像力が、AI研究者と同じレベルまで追いついてきた。
一般の人たちにも、「AIは何がすごいのか」っていうことが、ほぼ説明しなくてもわかるようになったのは非常に大きいです。
尾原:その辺は象徴的ですよね。どっちかっていうと、ChatGPTに関しては、マーケティングだと思うんです。このグラフがバズってるのが1番わかりやすくて。
これ、100万人のユーザーにリーチするのに、何日かかりましたか?っていう図なんです。
ネットフリックスは約40カ月で、インスタグラムが3カ月ぐらい。ChatGPTは(この記事によると)わずか5日間でした。
さっきのLAIONプロジェクトが象徴しているように、世界中のエンジニアが「みんなでやりたい」という力が集まっていくと、驚くほどあっという間にユーザーが広がっていきますからね。
OpenAIとしても、画像生成AI・Stabel Diffusionをめぐる2022年後半の爆発的な広がりを指をくわえて見ておくわけにはいかなかった。
(後編「「情報社会はアップロードが変えてきた」生成系AIで変わるビジネス【徹底討論:尾原和啓×清水亮】」に続きます)
尾原和啓:IT批評家。京都大学大学院工学研究科応用人工知能論講座修了。マッキンゼー、NTTドコモ、リクルート、グーグル、楽天などを経て現職。主な著書に『ザ・プラットフォーム』『ITビジネスの原理』『アフターデジタル』(藤井保文氏との共著)『アルゴリズムフェアネス』など。
清水亮:幼少期にプログラミングに目覚め、高校生からテクニカルライターとして活動。米大手IT企業で上級エンジニア経験を経て1998年に黎明期の株式会社ドワンゴに参画。2003年に独立して以降19年間に渡り、5社のIT企業の創立と経営に関わる。2018年より東京大学で客員研究員として人工知能を研究。主な著書に『よくわかる人工知能』など
あわせて読みたい