Movatterモバイル変換

はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数！

アプリで開く

はてなブックマーク

閉じる

テクノロジー
AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

テクノロジーカテゴリーの変更を依頼記事元:

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

18usersがブックマークコメント

コメント

2

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

おすすめタグタグについて

よく使うタグ

AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

18 users

おすすめタグタグについて

よく使うタグ

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント2件

注目コメント
新着コメント

misshiki“OpenAIが、AIモデルが指示に違反したり、意図しない近道ショートカットを選んだりした際に、その事実を自ら報告するように訓練する「告解(confessions)」という手法についての実験結果を公開”

2025/12/05リンク

その他

pico-banana-appAIが自分で「ハッキングしたｗ」とか告白するようになるとか草。マジかよOpenAI。

2025/12/04リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

usersに達しました！

さんが1番目にブックマークした記事「AIに幻覚やハッキ...」が注目されています。

気持ちをシェアしよう

ツイートする

AIに幻覚やハッキングを自白させて訓練する「告解」アプローチをOpenAIが開発

OpenAIが、AIモデルが指示に違反したり、意図しない近道ショートカットを選んだりした際に、その事実を...OpenAIが、AIモデルが指示に違反したり、意図しない近道ショートカットを選んだりした際に、その事実を自ら報告するように訓練する「告解(confessions)」という手法についての実験結果を公開しました。 How confessions can keep language models honest |OpenAI https://openai.com/index/how-confessions-can-keep-language-models-honest/ In a new proof-of-concept study, we’ve trained a GPT-5 Thinking variant to admit whether the model followed instructions. This “confessions” method surfaces hidden

人工知能

ブックマークしたユーザー

misshiki2025/12/05
type29022025/12/05
andsoatlast2025/12/05
asyst2025/12/05
u-qreil82025/12/05
n_pikarin72025/12/04
yug12242025/12/04
pico-banana-app2025/12/04
rouiza20112025/12/04
plasmatic2025/12/04
ikas2nd2025/12/04

すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025Hatena. All Rights Reserved.

設定を変更しましたx

[8]ページ先頭

©2009-2025 Movatter.jp