Movatterモバイル変換


[0]ホーム

URL:


テクノエッジ TechnoEdge
FOLLOW US
  • X
  • rss
  • youtube
新規会員登録 | ログイン
ホームテクノロジーAI記事

謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)

テクノロジーAI
山下裕毅(Seamless)

山下裕毅(Seamless)

  • homepage
  • X

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。

特集

SHARE

  • Facebookでシェア
  • Xでシェア
  • LINEでシェア
  • このエントリーをはてなブックマークに追加
謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)
  • 謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)
  • 謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)
  • 謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)

AI

編集部にメッセージを送る

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル(LLM)を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。

この論文はシンガポールのSapient Intelligenceと清華大学による研究発表です。Sapient Intelligenceはシンガポールに本社を置き、サンフランシスコと北京に研究センターを構えるグローバルなAGI研究企業です。精華大学卒の若き2人が創設し、チームメンバーにはGoogle DeepMind、DeepSeek、Anthropic、xAIの出身者が含まれます。

今回提案したオープンソースモデル「Hierarchical Reasoning Model」(HRM、階層的推論モデル)は、たった2700万パラメータという超軽量タイプ。比較すると、クローズドモデルはほとんど非公開なのでわかりませんが、OpenAIのGPT-3は1750億パラメータ、オープンモデルだとMetaのLlama 3で最大4050億パラメータです。

現在のLLMは、複雑な推論を行う際に「Chain-of-Thought」(CoT)と呼ばれる手法に依存しています。これは、問題を言語的なステップに分解して順次処理する方法ですが、タスク分解の脆弱性、データ量の要求が大きく、応答時間が遅いという課題があります。

HRMは人間の脳における階層的処理と時間スケールの分離という原理に着想を得ています。脳では、高次の皮質領域が抽象的で長期的な処理を担当し、低次の領域が詳細で即時的な処理を行います。これを模倣して、HRMは高レベルモジュールと低レベルモジュールという2つの相互依存する再帰的モジュールで構成されています。

▲脳にヒントを得たHRMは、異なる時間スケールで動作する2つの再帰型ニューラルネットワークを持つ

高レベルモジュールは抽象的な計画立案を担当し、ゆっくりと更新されます。一方、低レベルモジュールは詳細な計算を高速で実行し、各サイクル内で局所的な収束に達します。このプロセスにより、標準的な再帰型ニューラルネットワークが陥りがちな早期収束の問題を回避し、効果的な計算深度を大幅に増加させることに成功しています。

実験の結果は、わずか1000件のトレーニング例を使用し、事前学習やCoTなしで、HRMは複雑な推論タスクで卓越した性能を達成しました。人間には簡単だがAIには難しい汎用人工知能(AGI)を測定するベンチマーク「ARC-AGI-1」では40.3%の精度を達成し、これはOpenAIのo3-mini-highの34.5%、Claude 3.7 8Kの21.2%を上回る成果です。

特に、最先端のCoTモデルが完全に失敗する極めて困難な数独パズルで55%、30×30の迷路探索で74.5%という高い精度を達成しています。

さらに、リリース記事ではAGIを評価するより難しいベンチマーク「ARC-AGI-2」において、スコア5%のパフォーマンスを達成し、はるかに大きなサイズとコンテキスト長に依存するOpenAI o3-mini-high、DeepSeek R1、Claude 3.7 8Kなどを大幅に上回りました。

▲ベンチマークタスクにおけるHRMによる中間予測の可視化した図

▲1000件のトレーニング例で評価したベンチマークスコア


OpenAI「o3」は本当に“AGI”に近いのか? AGIレベルを評価する「ARC-AGI」の開発者が解説(生成AIクローズアップ) | テクノエッジ TechnoEdge
画像
OpenAIが最近発表したAIモデル「o3」と汎用人工知能(AGI)について、AGIの性能を評価するベンチマーク「ARC-AGI」の開発者フランソワ・ショレ氏(Googleの研究者)が考察した記事に注目します。
https://www.techno-edge.net/article/2024/12/23/3949.html続きを読む »

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ) | テクノエッジ TechnoEdge
画像
今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。
https://www.techno-edge.net/article/2025/03/31/4224.html続きを読む »
《山下裕毅(Seamless)》

SHARE THE STORYこの記事をみんなにシェア

山下裕毅(Seamless)

山下裕毅(Seamless)

  • homepage
  • X

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。

ショート動画

特集

TechnoEdge
BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。

有料会員限定コンテンツ

BECOME A MEMBER
『テクノエッジ アルファ』第二期会員募集中

会員コミュニティ「テクノエッジ アルファ」登録はこちら。イベント招待や限定コンテンツ、会員専用Discordサーバなど特典多数です

ショート動画

TECHNOEDGE.TV

Gen-Biz(ジェネビズ):生成AIで変わるビジネスの未来
Google Pixel 10 Pro Foldってどうなの?最新折りたたみスマホを語る(Pixel Watch 4 / Pixels Buds 2a)
XRグラスXREAL One Pro ってどう?ハンズフリー&デスクフリーなメガネ型ディスプレイ
ガラスコーティング剤歴8年の匠が調合した「TRIZON HEXA」でスマホの画面を守れ

おすすめ

ランキング

  1. スマホ博士がRazerのゲーミングノートPCを使い続ける理由(スマホ沼) 画像スマホ博士がRazerのゲーミングノートPCを使い続ける理由(スマホ沼)
  2. 2倍の容量とドライブ&メディアの低価格化で普及した「3.5インチMOディスク(第2世代)」(230MB、1994年頃~):ロストメモリーズ File025(再掲) 画像2倍の容量とドライブ&メディアの低価格化で普及した「3.5インチMOディスク(第2世代)」(230MB、1994年頃~):ロストメモリーズ File025(再掲)
  3. 台数限定の国内予約開始。サイバーパンク2077コラボのVITURE LumaサイバーXRグラス発売、世界1万台限定のリアル「キロシ」 画像台数限定の国内予約開始。サイバーパンク2077コラボのVITURE LumaサイバーXRグラス発売、世界1万台限定のリアル「キロシ」
  4. アップル、トヨタ車へのCar Key機能の対応を準備中との報。iPhoneでドアロックの解錠や施錠が可能に? 画像アップル、トヨタ車へのCar Key機能の対応を準備中との報。iPhoneでドアロックの解錠や施錠が可能に?
  5. AIハッカー vs. 人間のセキュリティ専門家、どちらが勝つ? 約8000台のコンピュータを舞台に戦わせてみた(生成AIクローズアップ) 画像AIハッカー vs. 人間のセキュリティ専門家、どちらが勝つ? 約8000台のコンピュータを舞台に戦わせてみた(生成AIクローズアップ)
アクセスランキングをもっと見る

連載

連載一覧
BECOME A MEMBER
『テクノエッジ アルファ』第二期会員募集中

会員コミュニティ「テクノエッジ アルファ」登録はこちら。イベント招待や限定コンテンツ、会員専用Discordサーバなど特典多数です

新着リリース一覧PR TIMES

テック系プレスリリースはこちら
ホームテクノロジーAI記事

TechnoEdge

©TechnoEdge. All rights reserved.
FOLLOW US
  • X
  • rss
  • youtube
©TechnoEdge. All rights reserved.

[8]ページ先頭

©2009-2025 Movatter.jp