Movatterモバイル変換

はてラボ

はてな匿名ダイアリー

ようこそゲストさん

ユーザー登録

はてな匿名ダイアリー

< anond:20250211183705 |anond:20250212093954 >

2025-02-12

■

あるAIのモデルがバカになったと言われる現象

最近特に顕著だなと思ったから、今日久々にClaudeで「9.11と9.9はどちらが大きいですか？」を試したの

したら去年のモデルアップデート後は何もしなくても正解率9/10くらいだったのが、正解率1/10だったのね

そこで返答モードを切り替えると、Explanatoryスタイルだけは高確率で正解、それ以外(Concise・Formal)はボロボロなの

ボロボロで共通するのは、結論が先に来ること

だからExplanatoryでも結論を先に持ってこさせたら、不正解率が激増した

次に、文脈を増やして「小数の比較において、9.11と9.9はどちらが大きいですか？」と聞いてみた

するとNormal スタイルもExplanatoryと同じように順序立てて最後に答えを出すようになったので正解率が上がり

ConciseとFormalは結論が先なので相変わらずボロボロ

結局、正解率があがる理由は「順を追って考えましょう」と段階的に考えて、最後に答えを出すからなんですね

思い返すと、モデルアプデ後のClaudeスタイルが追加される前の時期に正答率が高かった理由もそれかもしれない

やっぱりCoTしか勝たんな

9.11と9.9という2つの小数の大小関係を比較する必要があります。これは基本的な数学的比較問題です。
段階的な思考プロセス
まず、両方の数を小数点以下2桁まで見てみましょう。
9.11
9.90（9.9は9.90と同じです）
整数部分を比較します。
両方とも9なので、この部分では差がありません。
小数点以下第1位を比較します。
両方とも1なので、ここでも差がありません。
小数点以下第2位を比較します。
9.11の場合は1
9.90の場合は0

1は0より大きいので、9.11の方が大きいと結論づけられます。

頭おかしなるで

Permalink |記事への反応(0) | 09:43

ツイートシェア

記事への反応 -

記事への反応（ブックマークコメント）

permalinkTwitterでシェア Facebookでシェア

全てのコメントを見る

人気エントリ

過去の人気エントリをもっと見る

注目エントリ

はてなブックマークでもっと見る

ログインユーザー登録

ようこそゲストさん

Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp