Movatterモバイル変換

12:00-13:00以外の23 時間/7日はトレーニングにあてるらしい。インプットの組み合わせ爆発に学習が追いつかないそう。

その一時間のみ人間のプロンプトによるフィードバックを受けつけ、イレギュラーな時間に回答を吐き出すと。

⸻

• その他、利用許諾のあるテキストデータ

• 「人間が良い返答を選ぶ」訓練データを元にした強化学習（Reinforcement Learning withHuman Feedback）

⸻

OpenAIは、トレーニングにかかった日数は公開していません。

しかし、以下の点からある程度推測できます：

•GPT-4などの大型モデルは、数週間〜数ヶ月にわたって大規模なGPU/TPUクラスタでトレーニングされます。

• 数千〜数万枚のGPUを並列で動かす

⸻

1. 事前学習（Pretraining）

• 数兆語のテキストを使って、何が書かれそうかを予測するように学習。

• 膨大な計算資源（数百万ドル規模）が使われる。

2. 微調整（Finetuning）

•人間が望むような出力を出すように小規模データで調整。

• RLHFなどもここに含まれる。

⸻

🔐 非公開の理由

•商業的な競争上の理由（ライバル企業が真似しないように）

• 利用している具体的なデータやインフラ情報が極めて高価値であるため

⸻

まとめ

項目回答

総トレーニング期間数週間～数ヶ月

公開されているか一部のみ、詳細は非公開

2025-09-03