Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録
< anond:20250814172836 |anond:20250814172103 >

2025-08-14

GPT-5は何故重要なのか

GPT-5は壊れている。

これは感情的表現がどうこうという話ではなく、技術事実としての話だ。

とくにtool call周りの挙動は致命的に悪化している。

コーディングアシストに特化した」と説明されているのだが、現実問題としてGPT-4.1から置き換えると以下のようなことが起きる。

OpenAIGPT-5向けにシステムプロンプトのガイドを公開しているが、それを適用してもなお挙動は安定しない(お前がクソバカだからうまくいかないんだ、俺ならうまくやれるという人は金は払うからコンサルしてくれ)。

AIアプリケーション部品としては「壊れている」と評価せざるを得ないレベルだ。

では、なぜそれが「重要」なのか

ここでの問題は「壊れていること」自体ではない。

もっと重要なのは、「壊れている」という指摘がほとんど出てこないことだ。

もし本当にAIアプリケーションを開発しているなら、リリースを聞きつけてモデルgpt-4.1からgpt-5に差し替えみるくらいは自然な行動だろう。そして数分以内に「あ、これダメだ」と気づくはずだ。

にもかかわらず、その種の報告は非常に少ない(ゼロではないが、驚くほど少ない)。

GPT-5が明らかにしたこと

この事実が示すのは単純だ。

AIアプリケーションを本当に作っている人」はほとんどいないということだ。

ーーーーーーーーーー

上記GPT-5に生成させました。プロンプト 「GPT-5は何故重要なのか」というはてな匿名ダイアリー投稿する記事を書いてください。はてな匿名ダイアリーの読者層を想定して分かりやすく、よくあそこにあるような文体で書いてください。論旨:GPT-5は重要である。その理由は以下のとおり。GPT-5は非常にtool callの性能が低い。コーディングアシストに特化した(と主張する)特性からか知らないが、現実問題GPT-4.1から置き換えた場合単純にものすごく性能が劣化し、非協調的で敵対的動作(ツールを実行せずに実行したと報告するなど)を起し、ときには無限ループ突入し、出力が崩壊する。GPT-5向けのシステムプロンプトガイドなども公開されているが、それを用いた場合でも困難が多い。GPT-5はAIアプリケーション部品としては壊れている。このことが何故重要か。「GPT-5が壊れている」という言及が非常に少ないことが問題だ。もしあなたAIアプリケーションを開発している場合リリースを聞き、とりあえずモデルgpt-4.1からgpt-5に置き換えてみるぐらいのことはすぐにするはずだ。すると「これは壊れていて使い物にならない」ということがすぐに分かったはずだ。しかし、そのようなことをして「これは壊れている」という言及をしている人がすごく少ない(いないわけではない)。これこそがGPT-5の重要性だ。「AIアプリケーションを本当に作っている人」は殆どいないことを世に示した。GPT-5は最悪の壊れたリリースであるが、世の真実を明かにした最高のリリースだ。AIプロダクトをつくっていますという嘘つきをあぶりだしてくれる。

Permalink |記事への反応(8) | 17:30

このエントリーをはてなブックマークに追加ツイートシェア

記事への反応 -
  • クソバカって…増田の無駄な威勢の良さ、不必要な口の悪さを体現してしまっている。

  • 使ってる感じシステムプロンプトの簡素化で省力モードで動かしてる気がする しばいてやるとちゃんと働くが、指示が甘いと基本手抜きしようとする なんか3.5の時代に逆戻りしたような...

  • LLMあるあるの繰り返しハルシネーションかな

  • API利用して使ってるけど、5に切り替えて特に大きな劣化は感じてないよ。 おそらくあなたの使い方や入力に問題があるから、出力も問題が生じているんだと思うよ。 GPT-5 APIの説明は読...

  • 日本語で使うと駄目らしい

  • 同じプロンプトを俺のChat GPT55 thinkingにぶっこんらこうなった ` GPT-5は何故重要なのか 長文。観測範囲の話。話半分で読んでほしい。 でも、黙っているとますます状況が悪くなる気がし...

  • GPT-5が出たな。 まあ、AI触ってる人間なら、とりあえずは触ってみるだろ。俺もそうだ。早速、今までGPT-4.1で動かしてた自前のアプリケーションのモデルを、期待に胸を膨らませて`gpt-5`...

  • OpenAIは、親分のMicrosoftと同じく、開発者をないがしろにして一般ピープルに寄せたってことだと感じた。 一般ピープル向けに高度な推論を提供しても電気の無駄だし。

記事への反応(ブックマークコメント)

全てのコメントを見る

人気エントリ

注目エントリ

ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp