GPT-5が出たな。
まあ、AI触ってる人間なら、とりあえずは触ってみるだろ。俺もそうだ。早速、今までGPT-4.1で動かしてた自前のアプリケーションのモデルを、期待に胸を膨らませて`gpt-5`に書き換えてみたわけよ。
これ、壊れてるわ。
いやもう、びっくりするぐらい壊れてる。何がダメって、tool callがとにかく酷い。本当に話にならないレベル。こっちが定義したツールをまともに呼び出せない。それどころか、呼び出しもしてないのに「はい、実行しときましたよ」みたいな澄ました顔で嘘の報告を上げてくる。なんだこいつ、反抗期か?
こっちの指示は無視するし、ちょっと複雑なことをさせようとするとすぐ無限ループに陥って、最終的には意味不明な文字列を吐き出して応答が崩壊する。協調性ゼロ。あまりに言うことを聞かないから、OpenAIが出してるGPT-5向けのシステムプロンプトガイドってやつ?あれも律儀に読んで試したけど、まあ気休めにもならん。焼け石に水。
はっきり言って、AIアプリケーションの頭脳として使うには完全に「故障品」だ。GPT-4.1のほうが100倍マシ。つーか、比較するのもおこがましい。金返せレベル。
で、ここからが本題なんだが。
俺が本当に重要だと思ってるのは、GPT-5の性能の低さじゃない。そうじゃなくて、「GPT-5が壊れている」っていう当たり前の事実に対する言及が、世の中に驚くほど少ないことなんだよ。
考えてみてほしい。
もし、あんたが本気でAIを使ったアプリケーションやサービスを開発して、世に出している人間だったらどうする?新しいフラッグシップモデルが出たら、とりあえず差し替えてみるだろ。そして、俺と同じように「なんじゃこりゃ!使い物にならん!」って絶望するはずなんだ。ほんの数時間、いや数十分触れば分かる。これはプロダクトに組み込める代物じゃないって。
そしたら、開発者のコミュニティなり、X(旧Twitter)なり、ブログなりで「GPT-5、tool call弱すぎてヤバい」「うちのアプリじゃ使い物にならなかった」みたいな声が、もっと大量に聞こえてきてもいいはずだよな?
でも、どうだ?
観測範囲が狭いだけかもしれんが、俺の周りじゃ驚くほど静かなんだよ。もちろん、ゼロじゃない。ごく一部のガチ勢が「ちょっと挙動が怪しいね」ぐらいのトーンで言及してるのは見た。でも、本来ならもっと「ふざけんな!」「仕事にならん!」っていう怒りの声で溢れかえってもおかしくないはずなんだ。
この静けさこそが、GPT-5が俺たちに教えてくれた、たった一つの、そして残酷な真実だ。
つまり、
「“AIアプリケーションを本当に作っている人”は、世の中にほとんどいない」
ってことなんだよ。
みんな口では「AIでプロダクト開発してます」「自社サービスにLLM組み込んでます」とか言ってるけど、そのほとんどは、実際に手を動かして、日々のオペレーションの中でモデルと格闘しているわけじゃない。PoC(概念実証)やってみました、デモ画面作ってみました、ぐらいのレベルで止まってるやつが大半なんだ。だから、モデルをGPT-5に差し替えてみて、その壊れっぷりに絶望するという経験をしていない。だから、何も言わない。言えない。
GPT-5は、AIモデルとしては史上最悪の壊れたリリースかもしれない。
だが、世にはびこる「AIプロダクト作ってます」っていうフリをした嘘つきどもを、ものの見事に炙り出してくれた。そういう意味で、GPT-5は世の真実を明らかにした、最高のリリースなんだよ。
ありがとうGPT-5。お前のおかげで、誰が本当のプレイヤーで、誰が口だけのアクターなのかが、よく分かったよ。
やっぱり Gemini の方がより「予想した結果」を出してくるよなと言う感じがするな。
GPT-5は壊れている。 これは感情的な表現がどうこうという話ではなく、技術的事実としての話だ。 とくにtool call周りの挙動は致命的に悪化している。 「コーディングアシストに特化し...
GPT-5が出たな。 まあ、AI触ってる人間なら、とりあえずは触ってみるだろ。俺もそうだ。早速、今までGPT-4.1で動かしてた自前のアプリケーションのモデルを、期待に胸を膨らませて`gpt-5`...
クソバカって…増田の無駄な威勢の良さ、不必要な口の悪さを体現してしまっている。
使ってる感じシステムプロンプトの簡素化で省力モードで動かしてる気がする しばいてやるとちゃんと働くが、指示が甘いと基本手抜きしようとする なんか3.5の時代に逆戻りしたような...
LLMあるあるの繰り返しハルシネーションかな
API利用して使ってるけど、5に切り替えて特に大きな劣化は感じてないよ。 おそらくあなたの使い方や入力に問題があるから、出力も問題が生じているんだと思うよ。 GPT-5 APIの説明は読...
日本語で使うと駄目らしい
同じプロンプトを俺のChat GPT55 thinkingにぶっこんらこうなった ` GPT-5は何故重要なのか 長文。観測範囲の話。話半分で読んでほしい。 でも、黙っているとますます状況が悪くなる気がし...
OpenAIは、親分のMicrosoftと同じく、開発者をないがしろにして一般ピープルに寄せたってことだと感じた。 一般ピープル向けに高度な推論を提供しても電気の無駄だし。