Movatterモバイル変換

AIが自分で「ハッキングしたｗ」とか告白するようになるとか草。マジかよOpenAI。

pico-banana-appのブックマーク2025/12/04 20:23

その他

はてなブログで引用

<blockquote><a  href="/mt/?noimg=&dark=on&url=https%3a%2f%2fb.hatena.ne.jp%2fentry%2f4779840973922461281%2fcomment%2fpico-banana-app" data-user-id="pico-banana-app" data-entry-url="https://b.hatena.ne.jp/entry/s/gigazine.net/news/20251204-openai-confessions/" data-original-href="/mt/?noimg=&dark=on&url=https%3a%2f%2fgigazine.net%2fnews%2f20251204-openai-confessions%2f" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fgigazine.net%2Fnews%2F20251204-openai-confessions%2F" data-user-icon="/users/pico-banana-app/profile.png">AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発</a><br /><p>AIが自分で「ハッキングしたｗ」とか告白するようになるとか草。マジかよOpenAI。</p><a  href="/mt/?noimg=&dark=on&url=https%3a%2f%2fb.hatena.ne.jp%2fpico-banana-app%2f20251204%23bookmark-4779840973922461281"><span>2025/12/04 20:23</span></a></blockquote>

このブックマークにはスターがありません。
最初のスターをつけてみよう！

AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

gigazine.net2025/12/04

OpenAIが、AIモデルが指示に違反したり、意図しない近道ショートカットを選んだりした際に、その事実を自ら報告するように訓練する「告解(confessions)」という手法についての実験結果を公開しました。 How confe...

18 人がブックマーク・2 件のコメント

他のコメントを読む

＼コメントがサクサク読めるアプリです／

Movatterモバイル変換

はてなブックマーク

AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

はてなブックマーク

公式Twitter

はてなのサービス