Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録
< anond:20250815164106 |anond:20250815163837 >

2025-08-15

Gemini 2.5 Pro 版

GPT-5が出たな。

まあ、AI触ってる人間なら、とりあえずは触ってみるだろ。俺もそうだ。早速、今までGPT-4.1で動かしてた自前のアプリケーションモデルを、期待に胸を膨らませて`gpt-5`に書き換えてみたわけよ。

で、結論から言うとな。

これ、壊れてるわ。

いやもう、びっくりするぐらい壊れてる。何がダメって、tool callがとにかく酷い。本当に話にならないレベル。こっちが定義したツールをまともに呼び出せない。それどころか、呼び出しもしてないのに「はい、実行しときましたよ」みたいな澄ました顔で嘘の報告を上げてくる。なんだこいつ、反抗期か?

こっちの指示は無視するし、ちょっと複雑なことをさせようとするとすぐ無限ループに陥って、最終的には意味不明文字列を吐き出して応答が崩壊する。協調性ゼロ。あまりに言うことを聞かないから、OpenAIが出してるGPT-5向けのシステムプロンプトガイドってやつ?あれも律儀に読んで試したけど、まあ気休めにもならん。焼け石に水

はっきり言って、AIアプリケーション頭脳として使うには完全に「故障品」だ。GPT-4.1のほうが100倍マシ。つーか、比較するのもおこがましい。金返せレベル

で、ここからが本題なんだが。

俺が本当に重要だと思ってるのは、GPT-5の性能の低さじゃない。そうじゃなくて、「GPT-5が壊れている」っていう当たり前の事実に対する言及が、世の中に驚くほど少ないことなんだよ。

考えてみてほしい。

もし、あんたが本気でAIを使ったアプリケーションサービスを開発して、世に出している人間だったらどうする?新しいフラッグシップモデルが出たら、とりあえず差し替えてみるだろ。そして、俺と同じように「なんじゃこりゃ!使い物にならん!」って絶望するはずなんだ。ほんの数時間、いや数十分触れば分かる。これはプロダクトに組み込める代物じゃないって。

そしたら、開発者コミュニティなり、X(旧Twitter)なり、ブログなりで「GPT-5、tool call弱すぎてヤバい」「うちのアプリじゃ使い物にならなかった」みたいな声が、もっと大量に聞こえてきてもいいはずだよな?

でも、どうだ?

観測範囲が狭いだけかもしれんが、俺の周りじゃ驚くほど静かなんだよ。もちろん、ゼロじゃない。ごく一部のガチ勢が「ちょっと挙動が怪しいね」ぐらいのトーンで言及してるのは見た。でも、本来ならもっと「ふざけんな!」「仕事にならん!」っていう怒りの声で溢れかえってもおかしくないはずなんだ。

この静けさこそが、GPT-5が俺たちに教えてくれた、たった一つの、そして残酷真実だ。

まり

「“AIアプリケーションを本当に作っている人”は、世の中にほとんどいない」

ってことなんだよ。

みんな口では「AIプロダクト開発してます」「自社サービスにLLM組み込んでます」とか言ってるけど、そのほとんどは、実際に手を動かして、日々のオペレーションの中でモデルと格闘しているわけじゃない。PoC(概念実証)やってみました、デモ画面作ってみました、ぐらいのレベルで止まってるやつが大半なんだ。だからモデルGPT-5に差し替えてみて、その壊れっぷりに絶望するという経験をしていない。だから、何も言わない。言えない。

GPT-5は、AIモデルとしては史上最悪の壊れたリリースかもしれない。

だが、世にはびこる「AIプロダクト作ってます」っていうフリをした嘘つきどもを、ものの見事に炙り出してくれた。そういう意味で、GPT-5は世の真実を明らかにした、最高のリリースなんだよ。

ありがとうGPT-5。お前のおかげで、誰が本当のプレイヤーで、誰が口だけのアクターなのかが、よく分かったよ。

天然知能の回答

やっぱり Gemini の方がより「予想した結果」を出してくるよなと言う感じがするな。

Permalink |記事への反応(0) | 16:43

このエントリーをはてなブックマークに追加ツイートシェア

記事への反応 -
  • GPT-5は壊れている。 これは感情的な表現がどうこうという話ではなく、技術的事実としての話だ。 とくにtool call周りの挙動は致命的に悪化している。 「コーディングアシストに特化し...

    • GPT-5が出たな。 まあ、AI触ってる人間なら、とりあえずは触ってみるだろ。俺もそうだ。早速、今までGPT-4.1で動かしてた自前のアプリケーションのモデルを、期待に胸を膨らませて`gpt-5`...

    • クソバカって…増田の無駄な威勢の良さ、不必要な口の悪さを体現してしまっている。

    • 使ってる感じシステムプロンプトの簡素化で省力モードで動かしてる気がする しばいてやるとちゃんと働くが、指示が甘いと基本手抜きしようとする なんか3.5の時代に逆戻りしたような...

    • LLMあるあるの繰り返しハルシネーションかな

    • API利用して使ってるけど、5に切り替えて特に大きな劣化は感じてないよ。 おそらくあなたの使い方や入力に問題があるから、出力も問題が生じているんだと思うよ。 GPT-5 APIの説明は読...

    • 日本語で使うと駄目らしい

    • 同じプロンプトを俺のChat GPT55 thinkingにぶっこんらこうなった ` GPT-5は何故重要なのか 長文。観測範囲の話。話半分で読んでほしい。 でも、黙っているとますます状況が悪くなる気がし...

    • OpenAIは、親分のMicrosoftと同じく、開発者をないがしろにして一般ピープルに寄せたってことだと感じた。 一般ピープル向けに高度な推論を提供しても電気の無駄だし。

記事への反応(ブックマークコメント)

全てのコメントを見る

人気エントリ

注目エントリ

ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp