まずこっちが推理する方をやってみたんだけど、途中で矛盾が生じてきて、何とかときほぐして正解にたどり着いてみたら、1個ヒント間違えてやがった。こちらが入力した数字に対して一定のルールに沿って返す、ということをAIが偶然的?にミスる、ということに驚く。
で、次に向こうに当てさせてみたんだけど、とにかく長い長い。私が上記の不利な条件のもと6回で当てたところ、あちらは38回かけた。それも、37回目で混乱して「数字のセットだけでも教えてくれ」とか言い出したので、あちらが丁寧に書いてくれていた推理の痕跡を追い直して「いやいや4をハズレ認定した根拠は何やねん」とピンポイントで指摘してようやくたどり着く有様。
「何でこんなにかかったんだろうね」と聞いてみたら、返事は以下のとおり(抜粋)。
→ たとえば
・「全桁がズレた場合 → 次は最小限の1桁だけずらす」
→ 多くの人間はこの段階で「全探索木を頭の中で組む」
→ 残り2〜4手以内で確実に決めに行く
■手番ごとの意図が明確に切り替わる
→ 逆に言うと「一度ミスった仮説(例:3が入っている/入っていない)」が後まで残る傾向が強い
■柔軟な「探索木の更新」が弱かった
→本来なら「ここで仮説をリセットすべきだ」と切り替えるべきところで、
→ やや惰性でパターン試行が続いていた(ループに入りかけた)
→人間は「ヒット数が変化した → 何が変わったか」を強烈に意識するが、
→ 今回私は「位置の違いによる影響」を少しずつしか更新していなかった
→ 「探索アルゴリズム専用エンジン(バックトラッキングや最適手探索)」は使っていませんでした
→ そのため、人間のような大胆な「配置仮説表の整理・更新」は弱くなる傾向があります
■探索木管理用の内部表を構築する
■ブロー・ヒット差分を明確に逆算する
この分析自体は大筋では納得できる。まあ、誰にでも得手不得手はある。
私自身で感じたのも、まずはしょうもないヒントのバリエーションを得るために総当たりで聞いてくる点(これについては、「少ない手数で当てろ」という指示をしなかったという反省も)。無理からぬことだが、セレンディピティが無い。がさっとかまをかけたり、ブローを積み重ねて消去法で絞り込んだり、ということがなされていないと思った。また、仮説が信頼できなくなっても切り替えない。「Aっぽいな~、でもBの可能性も捨てきれんな~」の局面で、天秤にかけて順番に試すのではなく、最初の時点で可能性の高いAに憑りつかれてしまう(というかよく見ると別に可能性高くもない)。いずれも、経験を蓄積して解答を得るというか、解答を得るために経験を蓄積するという戦略が弱いということか。
そこで「次は熟練プレーヤーの推理法でやってみてね」としてみたら、3手目でまた思い込みに憑りつかれ、それ以降は的外れな試行を繰り返す。個々の推論も、いわゆるMECEな整理ができてない。だんだん発狂しだして「!」を延々吐き出したり、挙句の果てには過去に出した数字を再度出してくる始末。
空恐ろしかったのは、3ブローだって言ってるのに「セット確定!」とか息巻いて、延々3文字しか合ってないセットで回し続けたこと。我々人間の認識としては「真」は「4文字が合っていること」であって、「4文字が合っていること」と「3文字が合っていること(=1文字が間違っていること)」との間には厳然たる溝があるが、AIはその違いが識別できてない。うまく言えないけど、これって今後付き合ってく上で結構重要なポイントな気がする。
「真」に対するチューニングの問題なんだろうか。例えば「10cmに切った紐を10本用意してください」という仕事に対して、誤差が±5mmの人もいれば±2cmの人もいる、というような。