
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

遅ればせながら 「推論する生成AI」は実際には思考しているわけではなく、丸暗記した結果を返しているに...遅ればせながら 「推論する生成AI」は実際には思考しているわけではなく、丸暗記した結果を返しているに過ぎない - 渋谷駅前で働くデータサイエンティストのブログ https://tjo.hatenablog.com/entry/2025/07/23/173000 読んだんだけど これ、二本目の論文でo3のスコアが両方それなりに高いことも明かしてほしいんだよねーmodelo3puzzle87.6unpuzzle74.2 元の学習データに引きずられる誤答も当然あるんだろうけどさ こんなにスコア高いってことは、unpuzzleを丸暗記してるんですか?^o^ 「丸暗記した結果を返しているに過ぎない」ならそういうことになるよねー だけど2.5Proもそれなりのスコアやん っていうのでなんちゅーか 思考だの推論だのというメタファーは置いといて、よくあの結果からあの結論に行って納得できるな感がすごい