GPT-4 は 256パターン全部入りの Reasoningデータセットで 正答率 90 %、最新GPT-4o は 95 %。テンプレに頼らない人間作成文でも 70 %超えをキープしている。
LSAT(米ロースクール入試)の Logical Reasoning セクションでは 9/10 問正解=偏差値 160台。このスコアに至るのは人間でもかなりの上位層のみ。
単純な三段論法すらできないというのはもう過去の話ですが
Permalink |記事への反応(0) | 08:27
ツイートシェア