中国のAI企業・DeepSeekが、数学的推論に特化したAI・Proverの第2世代モデルである「DeepSeek-Prover-V2」を、Hugging FaceとGitHubに公開しました。同社の大規模言語モデル「DeepSeek-V3」のアーキテクチャを基盤としたMixture-of-Experts(MoE)モデルで、定理証明支援言語のLean 4を使って形式化した定理証明の生成を自動化するように設計されています。 deepseek-ai/DeepSeek-Prover-V2-671B · Hugging Face https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B deepseek-ai/DeepSeek-Prover-V2 https://github.com/deepseek-ai/DeepSeek-Prover

こんにちは!株式会社AI Nestです。今回は、スタンフォード大学の研究者による最新の取り組み「STP: Self-play LLM Theorem Provers withIterative Conjecturing and Proving」をご紹介します。本研究は、従来の強化学習(RL)やエキスパートイテレーション手法が抱えるデータ不足や報酬の希薄性という問題に挑戦し、自己対戦方式を用いて定理証明能力を飛躍的に向上させるアプローチを提案しています。論文では、定理の「予想(conjecturing)」と「証明(proving)」という2つの役割を同時に担うことで、学習データを自律的に拡充し、従来手法に比べ大幅な性能向上を実現しています。 タイトル: STP: Self-play LLM Theorem Provers withIterative Conjecturing and Pr

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く