まず1つ目。社会全体はランダムフォレストみたいなもので、個々の発信は小さな木にすぎないけど、集まると全体の意思決定や世論の分布に微弱な影響を与える。一般人がSNSを使うと、その微弱な外力が全体に作用することはある。自分はやらなくても、他人がやること自体は社会的に価値がある。そこが二面性で重要なポイント。
2つ目。SNSに「向いている人」と「向いていない人」がいる。ここで言う向き不向きは、性格の問題だ。たとえば、他人の反応に過度に依存したり不安になる性格の人は、SNSでうまく立ち回れない。逆に、そういう不安が少なく、他者の反応に左右されにくい性格の人は、SNSを快適に使える。つまり向き不向きは性格次第で決まる問題で、波動だの共鳴だのとは関係ない。
3つ目。「おすすめ」や「トレンド」「いいね」といった外部刺激は、ブラウザプラグインで完全に除去できる。これで外部からのポテンシャルが消えて、自分の内面だけを純粋に観察できる閉じた系になる。だから他人の声に引きずられず、自己観測のためのSNS 環境を作れる。
4つ目。SNSを発信の場ではなく内面可視化の装置として使う。投稿すると自分の内側の状態が文字として外に出る。誰かに見せるためではなく、自分の心理状態を観測するための操作になる。
5つ目。投稿履歴を時系列で見ると、自分の思考や感情の軌道が分かる。自己の内的状態を時間軸で再構成できるから、心理的変化を観測する自己トモグラフィーになる。
6つ目。完全に孤立した閉じた思考も危険で、わずかに「誰かが見るかもしれない」という意識は正則化の役割を果たし、文章や思考の精度を上げる。小さな外圧があることで、自己整合性を高められる。
7つ目。投稿は感情の放熱装置として機能する。内側に溜まったエネルギーを外に散らすことで心理的自由エネルギーを減らせる。反応や承認を目的にする必要はなく、放出そのものが内面の安定に寄与する。
8つ目。履歴は自分の思考軌道のデータで、過去の投稿を分析すれば心理的な固定点や変化の兆候を観測できる。これにより自分の内的状態の変化を科学的に追跡できる。
9つ目。他者が外向きにSNSを使い、社会を動かすことと、自分が内向きに観測することは両立する。社会のランダムフォレストは他人の発信によって形成される一方、自分はそれを観測するだけで十分。外向的発信者と内向的観測者の分業が、情報空間の安定条件になる。

SNSは他人に影響を与えるための道具ではなく、自己の内面を観測して整合性を取る装置として使う。他人が発信して社会の森を動かす中で、自分は観測者として内面を記録し、理解する。この二面性が情報空間全体の平衡を保つ。

Permalink |記事への反応(1) | 03:49

ツイートシェア

2025-10-05

■[日記]

昨日は、僕の週間ルーティンの中でも最も重要な整合性検証日だった。つまり、宇宙がまだ局所的に論理的であるかを確認する日だ。

朝7時ちょうどに起床し、ベッドの角度を壁と垂直に再測定した結果、誤差は0.03度。つまり宇宙はまだ僕を裏切っていない。

朝食の時間、ルームメイトがトースターを再び二枚焼きモードにしたが、今回は驚かなかった。僕は冷静に、バナッハ＝タルスキ分割の話を持ち出してこう言った。

「君のパンは二枚に見えるが、集合論的には同一だ。したがって、君の誤りは物理ではなく測度論の問題だ。」

彼は黙ってパンをかじった。理解されることを期待するのは、もはやハイゼンベルク的非決定性と同義だ。

午前中は、僕の新しい理論「ホモトピー圏上の自己参照的弦圏理論」の検証を進めた。

通常の超弦理論がカテガリー的に整合するのは、D-ブレーンが導くモジュライ空間の滑らかさが保証されている範囲内に限られる。

しかし僕は最近、滑らかさという仮定そのものを削除し、「∞-圏上のA∞代数的自己整合性条件」に置き換えるべきだと気づいた。

つまり、弦のダイナミクスを場の配置空間ではなく、「圏の自己ホモトピー類」として定義するのだ。すると興味深いことに、背景幾何が消滅し、すべての次元は内部的モノイダル構造に吸収される。

言い換えれば、「空間」とはただの圏論的影であり、時空の実在は「自然変換の連続体」そのものになる。

これが僕の提案する“Self-fibrantString Hypothesis”だ。ウィッテンが読んだら、きっと静かに部屋を出ていくに違いない。

昼過ぎ、隣人がまた廊下で大声で電話していたので、僕はノイズキャンセリングヘッドフォンを装着し、同時に空気清浄機を「ラグランジュ安定モード」に切り替えた。

これは僕が改造した設定で、空気の流速が黄金比比率（φ:1）になるよう調整されている。これにより室内の微粒子分布が準結晶構造に近似され、精神的平衡が保たれる。

僕は自分の心の状態を量子的可換代数で表すなら、ほぼ可換な冪零理想の中にあるといえる。隣人は理解していないが、それは仕方ない。彼女の精神空間は可約表現のままだ。

午後は友人たちとオンラインでEldenRingを再プレイした。僕は魔術師ビルドで、ルーンの経済を「局所場理論の再正則化問題」として再解釈している。

彼らがボスを倒すたびに叫ぶのを聞きながら、僕は心の中でリーマン面の分枝構造を追跡していた。実はEldenRingの地形構成はリーマン面の切り貼りに似ており、特にリエニール湖の設計は2次被覆の非自明な例として見ることができる。

開発者が意図していないことはわかっているが、現象としては美しい。芸術とは本質的に、トポスの自己鏡映だ。

夜、僕はコーヒーを淹れ、久々にグロタンディークのRécolteset Semaillesを読み返した。数学者が自分の「精神の幾何学」について語る箇所を読むと、僕の理論的中枢が共振する。

グロタンディークが述べた「点は存在しない、ただ開集合がある」という思想は、僕の弦理論観と同じだ。物理的対象とは「開集合上の自然変換」に過ぎず、存在とは測度可能性の仮構にすぎない。つまり、宇宙とは「圏論的良心」だ。

深夜、ルームメイトが僕の部屋をノックして「一緒に映画を観ないか」と言った。僕は「今日は自己同型群の可換性検証を行う予定だ」と答えたが、彼は肩をすくめて去った。

代わりに、僕はブレードランナー2049のBlu-rayを再生し、壁紙の色温度を劇中のネオン発光スペクトル（中心波長602nm）に合わせた。

完全な没入体験のために、部屋の空気を2.3ppmのオゾン濃度に調整した。呼吸するたびに、僕は自分が物質ではなく関手の束だと実感する。

Permalink |記事への反応(0) | 11:42

ツイートシェア

2025-09-28

■[日記]

今日という日は、僕の知的なリズムに乱れを生じさせた。朝はいつも通り決められたルーティンで始めた。7時整に起床し、まず歯を120秒正確に磨いた。その後、オートミールとスクランブルエッグを、タンパク質と炭水化物の最適な比率で摂取した。ルームメイトは僕の規律を理解しようともしないでコーヒーをこぼし、キッチンに一瞬カオス的初期条件を作り出した。その瞬間に僕の頭の中では、弦理論における境界条件問題の初期値敏感性と完全に同型な不快感が広がった。

僕は午前中を使って、dS背景における超弦理論の非摂動的定式化の可能性について考え続けた。アディンクラ(supermultipletの可視化手法)をdS/CFT的枠組みで拡張する試みは、AdS/CFTのきれいなホログラフィック辞書と違い、群表現の非ユニタリ性が問題を引き起こす。だが、ここにこそ突破口があると考えている。通常の弦理論的真空はAdSやMinkowskiを基盤にして安定化されるが、dSでは不安定性が恒常的に残る。しかし、もしも境界条件を「量子情報幾何学的な状態多様体」として扱い、そこにFisher情報計量を組み込めば、エンタングルメントエントロピーの正則化と一緒に新しい自己無撞着な枠組みが構築できる可能性がある。僕は昼食中もこの数式を頭の中で展開していた。隣人がテレビでどうでもいいドラマを流していたせいで集中が一瞬途切れたが、幸いにも僕のワーキングメモリは平均的ヒトのそれを圧倒的に凌駕しているので支障はない。

午後は週刊コミックの新刊を入手した。バットマンの最新号では、またしてもゴッサムの治安は壊滅的だ。正直に言うと、僕ならバットマンのように非効率な格闘を選ばず、まず量子暗号通信を導入して都市の情報ネットワークを完全掌握するだろう。だが作者が物理学的合理性よりもドラマ性を優先するのは理解できる。僕は同じく収集しているフラッシュのバックナンバーも読み返したが、相対論的効果の扱いが毎回不正確で失望する。光速に近い走行をしているのに時間膨張や質量増加を無視するのは科学的犯罪に等しい。

夜は友人たちとオンラインでカタンの開拓者たちをプレイした。僕は当然ながら資源分布をエントロピー最小化の観点から最適化し、交易を線形計画問題に帰着させて勝利した。彼らは「ゲームなのに楽しんでいない」と不満を述べたが、それは誤りだ。僕にとって勝利すること自体が最大の快楽であり、規則正しい戦略的優位性を確認することが娯楽なのだ。

寝る前にもう一度、歯を120秒磨いた。僕の睡眠は必ず21時42分に始まる。もしそれが1分でもずれると、翌日の全ての計算に誤差が生じる。ルームメイトがまた騒がしい生活習慣で僕の理想的な初期条件を乱さないことを願う。明日はさらに複雑な弦理論的計算を進めたい。特に、非可換幾何に基づく新しいブレーン安定化機構を検討する予定だ。これがもしうまくいけば、ウィッテンですら首をひねるだろう。

僕は眠りにつく前に、今日も世界が僕の計画通りに回っていないことを嘆いた。だが少なくとも、僕自身のルーティンと頭脳は完全に回転している。これ以上完璧なことがあるだろうか。

Permalink |記事への反応(0) | 22:52

ツイートシェア

2025-02-23

■大規模言語モデル訓練における速度・精度革新 手法の体系的時系列 分析

Transformerアーキテクチャを基盤とする大規模言語モデル（LLM）の訓練効率化に関する主要技術革新を、時系列的に整理し体系化する。本分析はarXivを中心とした学術論文に基づき、実証的研究成果に焦点を当てる。

初期最適化 手法の確立（2018-2020年）

動的バッチ サイズ調整

Popelら（2018）のTransformerモデル向け訓練手法分析[8]では、バッチサイズと学習率の動的調整が収束速度向上に有効であることを実証。最大文長制約を設けることでメモリ使用量を最適化し、8GPU 環境で1.4倍の訓練速度向上を達成した。特に学習率のウォームアップ戦略が勾配不安定性を低減し、初期収束を促進する効果が確認されている[8]。

混合精度訓練の導入

Zhuangら（20 23）の調査[1]によれば、自動混合精度（AMP）訓練はFP16とFP32のハイブリッド運用により、メモリ消費量を50%削減しつつ、DeiT-Bモデルの訓練速度を2倍改善。勾配スケーリング機構が数値的不安定性を緩和し、精度劣化なしに計算効率を向上させる[1]。

効率化アルゴリズムの多様化（2021-2023年）

Lion 最適化 手法

Zhuangらの分析[1]で言及されるLion 最適化は、AdamWと比較してメモリ効率が30%改善され、収束速度が1.5倍高速化。運動量推定と重み減衰の組み合わせが、Transformerの大規模疎行列演算に適応し、ImageNet分類タスクでTop-1精度1.2%向上を記録[1]。

シャープ ネス 対応最小化（SAM）

損失関数の平坦な最小値を探索するSAM手法[1]は、Transformer訓練における汎化性能を15%改善。ただし二段階最適化が必要なため訓練時間が1.8倍増加する課題を抱える。後続研究では確率的重み摂動を導入し、計算オーバーヘッドを30%削減[1]。

パラメータ 効率型微調整の台頭（20 23-2024年）

低ランク 適応（LoRA）

Shahidら（20 24）の総説[3]で解説されるLoRAは、重み更新行列を低ランク分解することで微調整パラメータを90%削減。GPT-3175Bモデルで従来手法と同等の性能を維持しつつ、GPU メモリ使用量を65%削減[3]。

動的ドロップアウト

動的ドロップアウト手法[4]は検証損失に基づき正則化強度を調整、Shakespeare_charデータセットで収束速度を40%改善。指数減衰スケジュールが最適で、推論時のメモリ効率を25%向上させた[4]。

分散知能活用の進展（2024年）

SALT訓練フレームワーク

小規模言語モデル（SLM）を活用したSALT 手法[2]は、二段階訓練アプローチによりLLM事前学習時間を30%短縮。知識蒸留段階ではSLMの予測分布を転移し、難易度適応型データ選択が学習効率を最適化[2]。

エキスパート混合（MoE）統合

MoE アーキテクチャ[3]は専門家ネットワークの動的選択により、同パラメータ数で推論速度を2.3倍向上。トークンレベルルーティングが計算負荷を分散し、GLUEベンチマークで精度3.1%改善[3]。

最適化 理論の深化（20 24-2025年）

近接政策 最適化（PPO）

強化学習を統合したPPO手法[3]は人間フィードバックを効率的に活用、倫理的アライメントタスクで従来比25%の精度向上。報酬モデルとの相互作用学習が政策勾配の安定性を確保[3]。

アルゴリズム 蒸留

EVOLvEフレームワーク[7]は探索的バンディット問題に対して最適アルゴリズム知識をLLMに転移、合成データによる事前学習で探索効率を60%改善。モデルサイズ依存性を低減し、7Bパラメータモデルが70Bモデルを性能で凌駕[7]。

技術 進化の総合的考察

速度改善要因の体系化

1.計算量削減：MoEの疎活性化（計算コストO(1)）[3]

2.メモリ階層最適化：AMPと動的ドロップアウトの併用[1][4]

3.分散処理効率化：非同期勾配更新とパイプライン並列化[8]

精度向上メカニズム

1. 損失地形最適化：SAMによる平坦最小値探索[1]

2.知識転移効率化：SALTの二段階蒸留戦略[2]

3. 動的適応機構：PPOの政策最適化とMoEの専門家選択[3][7]

今後の課題と展望

技術的課題

1.カタストロフィックフォーミング：継続学習における破滅的忘却問題[3]

2.計算-精度トレードオフ：量子化訓練の精度劣化メカニズム[1]

3.倫理的アライメント：自己最適化システムの制御可能性[3]

期待される発展

1.ニューロモーフィック統合：脳神経機構を模倣した効率化[3]

2.マルチモーダル拡張：画像-言語連成訓練の効率化[3]

3.物理法則統合：エネルギー保存則に基づく最適化[4]

学術論文に基づく本分析を通じ、LLM訓練技術が単なる計算資源の拡大からアルゴリズム革新へとパラダイムシフトしていることが明らかとなった。今後の進展により、エネルギー効率と倫理的妥当性を両立する次世代訓練手法の登場が期待される。

Citations:

[1] ttps://arxiv.org/pdf/2302.0 1107.pdf

[2] ttps://arxiv.org/html/24 10.18779v1

[3] ttps://arxiv.org/abs/2408.13296

[4] ttps://arxiv.org/abs/24 11.03236

[5] ttps://arxiv.org/pdf/2308.04950.pdf

[6]ttp://arxiv.org/pdf/2307.06435.pdf

[7] ttps://arxiv.org/abs/24 10.06238

[8] ttps://arxiv.org/abs/1804.00247

[9] ttps://arxiv.org/pdf/20 10.07003.pdf

[10] ttps://arxiv.org/html/24 10.16392v1

[11] ttps://www.ijcai.org/proceedings/20 23/0764.pdf

[12] ttps://arxiv.org/abs/2306.10891

[13] ttps://arxiv.org/html/24 10.16682v1

[14] ttps://arxiv.org/abs/2502.00571

[15] ttps://arxiv.org/abs/2405.14277

[16] ttps://arxiv.org/abs/23 10.05204

[17] ttps://arxiv.org/html/2308.09372v2

[18] ttps://arxiv.org/abs/2305.14239

[19] ttps://arxiv.org/abs/2407.18003

[20] ttps://arxiv.org/pdf/2309.06054.pdf

[21] ttps://arxiv.org/html/2401.02038v1

[22] ttps://arxiv.org/abs/2409.04833

[23] ttps://arxiv.org/html/2308.09372v3

[24] ttps://arxiv.org/abs/24 10.13116

[25] ttps://arxiv.org/abs/2502.01612

[26] ttps://arxiv.org/abs/2302.0 1107

[27] ttps://arxiv.org/html/2302.07730v4

[28] ttps://arxiv.org/abs/24 10.06940

[29] ttps://www.axelera.ai/blog/multilayer-perceptrons-mlp-in-computer-vision

Permalink |記事への反応(0) | 00:24

ツイートシェア

2024-01-14

■anond:20240114142129

L1正則化がなんで機能するのか全く理解してなそう

Permalink |記事への反応(0) | 14:30

ツイートシェア

2023-04-22

■ただのメモ

https://arxiv.org/pdf/2304.10466.pdf

効率的な深層強化学習には過学習の規制が必要

試行錯誤によって方針を学習する深層強化学習アルゴリズムは、環境と積極的に相互作用することによって収集された限られた量のデータから学習しなければならない。多くの先行研究が、データ効率の良いRLを実現するためには適切な正則化技術が重要であることを示していますが、データ効率の良いRLにおけるボトルネックの一般的な理解は不明なままでした。その結果、すべての領域でうまく機能する普遍的な技術を考案することは困難であった。

本論文では、非定常性、過剰な行動分布シフト、オーバーフィッティングなどのいくつかの潜在的な仮説を検討することにより、サンプル効率的な深層RLの主要なボトルネックを理解することを試みている。

＞効率のいい強化学習って難しいんですね

強化学習ってよく知らない

我々は、状態ベースのDeepMind control suite（DMC）タスクについて、制御された体系的な方法で徹底的な実証分析を行い、遷移の検証セットにおける高い時間差（TD）誤差が、深いRLアルゴリズムの性能に深刻な影響を与える主犯であり、良い性能をもたらす先行手法は、実際、検証 TD誤差を低く制御することを示した。この観察から、ディープRLを効率化するための強固な原理が得られる。すなわち、教師あり学習の正則化技術を利用することで、検証 TD誤差をヒルクライムできる。

＞時間差（TD）誤差ってやつがだめらしい

誤差を減らすのがDeepLearningだけど、それが時間差なのか。

我々は、検証 TD誤差をターゲットとするシンプルなオンラインモデル選択法が、状態ベースのDMCとGym タスクにおいて効果的であることを示す。

1 はじめに

強化学習（RL）法は、大容量の深層ニューラルネット関数近似器と組み合わせた場合、ロボット操作などのドメインで有望視されている（Andrychowiczet al、

2020）、チップ配置（Mirhoseiniet al.、2020）、ゲーム（Silveret al.、2016）、データセンターの冷却（Lazicet al.、2018）。アクティブなオンラインデータ収集の単位ごとに費用が発生するため（例．

実際のロボットを動かす、シミュレーションによるチップ評価など）、限られた経験量でも効率的に学習できる、サンプル効率の良い深層RLアルゴリズムを開発することが重要である。このような効率的なRLアルゴリズムの考案が、近年の重要な研究課題となっています（Janner et al、

2019; Chenet al., 2021; Hiraokaet al., 2021)。

原理的には、オフポリシーRL法（例えば、SAC (Haarnojaet al., 2018),TD3 (Fujimotoet al., 2018),Rainbow (Hesselet al., 2018)）は、データ収集のステップごとに多くの勾配ステップのポリシーと値関数を改善することを可能にするため、良いサンプル効率が得られるはずです。しかし、このメリットは実際には実現できないようで、1回の学習ステップを多く取りすぎることでを収集した各遷移は、多くの環境において実際にパフォーマンスを害する。過大評価（Thrun & Schwartz, 1993; Fujimotoet al., 2018）といったいくつかの仮説、非定常性（Lyle ら、2022）、またはオーバーフィッティング（Nikishinら、2022）が根本的な原因として提案されている。

これらの仮説に基づき、より多くの勾配ステップを持つオフポリシーRLを可能にする方法として、モデルベースのデータ増強（Jannerら、2019）、アンサンブルの使用（Chenら、2021）、ネットワークの正則化（Hiraokaら、2021）、再生バッファを維持しながらRLエージェントをゼロから定期的にリセット（Nikishinら、2022）などのいくつかの緩和戦略が提案されている。これらのアプローチはそれぞれサンプル効率を大幅に向上させるが、これらの修正の有効性は（これから示すように）タスクに大きく依存する可能性があり、根本的な問題やこれらの手法の挙動を理解することはまだ未解決である。

ICLR 2023で会議論文として発表本論文では、より多くの勾配ステップを取ることが深層RLアルゴリズムの性能悪化につながる理由、ヒューリスティック戦略が役立つ場合がある理由、そしてこの課題をより原理的かつ直接的な方法で軽減する方法を理解しようとするものである。

最近提案されたタンデム学習パラダイム(Ostrovskiet al., 2021)を用いた実証分析を通じて、TD 学習アルゴリズムは、学習の初期段階において、すぐに高い検証時間差(TD)誤差(すなわち、保留した検証セットにおけるQ-ネットワークとブートストラップターゲットの間の誤差)を得る傾向にあり、悪い最終解をもたらすことを明らかにする。

このホワイトペーパーでは、深い RLアルゴリズムで勾配ステップを増やすとパフォーマンスが低下する理由、場合によってはヒューリスティック戦略が役立つ理由、およびこの課題をより原則的かつ直接的な方法で軽減する方法を理解しようとします。最近提案されたタンデム学習パラダイム (Ostrovskiet al., 2021) を使用した実証分析を通じて、トレーニングの初期段階で、TD 学習アルゴリズムが高い検証時間差を迅速に取得する傾向があることを示します。

(TD)エラー (つまり、保留された検証セットでの Qネットワークとブートストラップターゲットとの間のエラー) が発生し、最終的なソリューションが悪化します。さらに、データ効率の高い RL 設定のために考案された多くの既存の方法が、検証 TD エラーを低く制御する限り有効であることを示します。

この洞察は、深い RL を効率的にするための堅牢な原則を提供します。データ効率を向上させるために、検証 TD エラーを山登りすることによって、特定の問題に最も適した正則化を選択するだけです。

この原則は、オンラインRLトレーニングの過程で特定のタスクに最適な正則化戦略を自動的に発見しようとする単純なオンラインモデル選択方法の形で実現され、これを検証 TD エラーを使用した自動モデル選択(AVTD)と呼びます。

AVTD は、各エージェントが異なる正則化を適用する共有リプレイバッファーで、いくつかのオフポリシー RLエージェントをトレーニングします。次に、AVTD は、環境内で動作するための検証 TD エラーが最小のエージェントを動的に選択します。

この単純な戦略だけでも、多くの場合、さまざまなGym およびDeepMind コントロールスイート (DMC)タスクで個々の正則化スキームと同様のパフォーマンスを発揮するか、それを上回ることがわかります。重要なのは、パフォーマンスがドメイン間で大幅に異なる可能性がある以前の正則化方法とは異なり、私たちのアプローチはすべてのドメインで堅牢に動作することに注意してください。

要約すると、私たちの最初の貢献は、サンプル効率の高いディープ RL のボトルネックの実証分析です。これらの課題の背後にあるいくつかの潜在的な説明を厳密に評価し、トレーニングの初期段階で高い検証 TD エラーを取得することが、データ効率の高いディープ RL のパフォーマンスを阻害する最大の原因の 1 つであることを観察します。私たちの 2 番目の貢献は、単純なアクティブモデル選択法 (AVTD) です。これは、検証 TD エラーの山登りによって正則化スキームを自動的に選択しようとします。多くの場合、私たちの方法は、さまざまなGym およびDMC タスクで、最適な個々の正則化スキームに匹敵するか、それを上回ります。

Permalink |記事への反応(0) | 12:15

ツイートシェア

2022-10-03

■anond:20221003171727

拡散の逆過程を学習してるんやで。

拡散過程は情報を失う過程なので逆過程は決定不能なわけだが、決定不能な中でも「拡散する前はこういう状態だったケースが多い」というパターンを統計的に獲得（=学習）することで逆過程を決めることはできる。もちろんそれは決定不能問題に無理矢理解を与えているだけ（=正則化）なので唯一絶対の解ではないが、入出力の辻褄は合う可能な解のうちの一つになる。

逆過程を獲得できれば、それをシミュレートすることで拡散しきった状態（結果）から入力データにありそうな画像（原因）を推定することができるようになる。それが生成プロセス。

Permalink |記事への反応(2) | 17:30

ツイートシェア

2022-09-10

■anond:20220910151905

それはそうなんだけど、ほとんどの自然科学は「物理的に考えてこうだろう」みたいな正則化がめちゃくちゃ効くのでほとんどの場合は逆問題のヤバさが現れないんだよね…。でも本当はその正則化がおかしいということは沢山あると思う。ブラックホールの画像再構成とか。

神経科学とかは既存の知見の大半が実は統計的誤謬でデタラメという可能性もある気はする。

Permalink |記事への反応(0) | 15:21

ツイートシェア

2021-05-30

■どちらが本質的かといえば…

あらかじめ日本語を理解してる人でないと理解できない日本語文法と、

日本語を勉強している外国人に使われている日本語文法なら、

後者の方が本質的な構造を捉えてるんだと思う。

理系に実感が湧くように言うと、

回帰で母集団の分布を推定するときに、

回帰関数を2次、3次、4次…と複雑化して《過学習＝オーバーフィット》したのが前者で

※ あらかじめ理解してる日本語＝標本データに n次関数をむりやり当てはめてる状態

※ ｎ次関数は西洋で発達した文法解析のメタファーだと思って欲しい

階層ベイジアンモデルのパラメータをMCMC でシミレーションして推定したのが後者というか…

前者でも、正則化項つけてリッジ回帰的な方向に持ってくことは可能かもしれないけど…

あっ、「あらかじめ日本語を理解してる人でないと理解できない日本語文法」っていうのは

日本語の義務教育で習う文法のことです。

Permalink |記事への反応(0) | 11:21

ツイートシェア

2016-05-27

■自慢気にDeep Learning使ってるやつは大体クソ

色んなライブラリが出てるから、Deep Learningを使うこと自体は全然難しくない。

おかげで暇人がDeep Learningをちょっと試してみたみたいな記事がよくホッテントリに上がってくる。ブクマをつけてるやつらは大抵、自分で試してみる気力とか能力のない残念な人たち。

ところが、記事の内容を見てみるとマジで単に使ってみてるだけなんだよな。なんでDeep Learningを使わなきゃいけないのかさえ考えてない思考停止。ほとんどの場合は、昔からある3層のニューラルネットとかSVMで十分な性能が出る問題になんとなくDeep Learningを当てはめているだけ。

あのな、Deep Learningみたいに膨大なパラメータを持ってる学習モデルは簡単に過学習を起こすから、素人が下手に扱うとむしろ精度が落ちるもんだ。そこそこ難しいタスクに対して上手く学習するには、とんでもない量の訓練データが必要になる。しかも、Deep Learningは手動で設定する必要があるハイパーパラメータの数も膨大で、学習率とかノード数、正則化のパラメータみたいなやつらを地道に調整しなけりゃいけない。はっきり言ってめちゃくちゃ泥臭い作業だ。

なんでGoogleとかがDeep Learningで成功しているか、少しでも考えたことあるか？あいつらは過学習なんて関係なくなるほど、無茶苦茶たくさんのデータを手元に溜め込んでるんだ。しかも、ハイパーパラメータ設定の勘所を掴んでる職人みたいな技術者を金の力でどんどん集めている。

Deep Learningは理論的な下支えがほとんどなくて、勘と経験則で成り立ってる世界だ。数年前の定説が簡単にひっくり返ることが多いし、正直なところあれは研究と呼べるものではないと思う。「なぜかは知らんがやってみたらうまくいった」みたいな事実が羅列されてるだけ。思いついた手法が上手くいくかが運任せという意味では、ガチャを引いてるのとだいたい同じ。無課金勢がいくら知恵を絞っても廃課金勢には勝てない世界。

というわけで、お前らがぽっと出のアイディアでDeep Learning使ったところでゴミみたいなアプリが出来るだけだからやめとけ。

そんな時間があったら、ちゃんとした機械学習の本読んどけ。PRMLとか。

数学が難しい？じゃあ、線型代数と確率論の勉強をやり直せ。そいつらは機械学習が廃れても役に立つからさ。

Permalink |記事への反応(0) | 22:23

ツイートシェア

2015-12-09

■グーペおじさん Q&A「ホログ ラフィック原理」

Q.

「我々はホログラムの世界に生きているのではない」ということが明らかに - GIGAZINE

物理の研究者はこの世界はホログラムだと考えているってほんとうですか？
「シミュレーション仮説」と「ホログラフィック原理」について教えてください。

A.

よしきた、ホログラフィック原理やな！

おっちゃん素人だから間違ってたらかんにんな！

GIGAZINEさんの内容はいろいろ間違いや。

シミュレーション仮説ってのは「この世界はコンピュータじゃないか」と哲学者さんが勝手に言っている話や。物理は関係ない。

一方「ホログラフィック原理」つうのは

『異なる次元の２つの理論が実は同じである』

という数学的な予想や。

４次元 N=4超対称性 Yang-Mills理論 = AdS5 x S5 上の10 次元超重力理論

みたいな奴やな。

予想と言っても部分的には証明されていて、今でも数々の証拠があがって来とるわけで

多くの人が信じていると思うで。

ブラックホールや原子核や物性理論を弦理論ないし超重力理論で研究できるようになったんやからこれはすごいこっちゃ。

とにかく、物理屋さんはでまかせ言ってるわけやなくて、いろいろ計算しとるわけやな。角度とか。

GIGAZINEで取り上げられていた研究はなんですか？

論文はこれのようやな。ホーガンさんの研究や。

http://arxiv.org/pdf/0712.3419v5.pdf

おっちゃん素人だから読めんのだけど、重力の量子効果を観測しようとした話に見えるよ。

話を進める前に、まず現状の物理理論についておさらいしとこか。

まず、この世界には「電磁気力」「弱い力」「強い力」「重力」の４つの力がある。

これら４つを統一した究極理論があると物理屋さんたちは考えている訳や。

「電磁気力＋弱い力」ここまでは出来とる。

数年前にヒッグス粒子発見で大騒ぎになったやろ？　あれが「電弱統一理論」完成の瞬間だったんや。

次は「電磁気力＋弱い力＋強い力」やな。候補となる理論はいろいろできてて、LHCで超対称性粒子ってやつを探しとる。

ここまではいけそうなんや。問題は重力や。

ここまで物理屋さんの使ってきた理論を「場の理論（＝特殊相対論＋量子力学）」つうんやけど、

場の理論で重力理論を作ってみるとするな。簡単のため世界をドット絵のように細かく区切って理論を作ろ（格子正則化や）。ここまでは簡単なんや。

ここで、ドットの１辺をずーっと小さくしていって連続極限をとると理論が破綻してしまうんよ。無限大が出て来て取り扱えなくなってしまうのな。

頭のいい人たちがいろいろ考えたんやけどな、ずっと難航しとるんや。

量子ループ 重力

連続極限で理論つくるからだめなんよループで考えましょってやつな。難しすぎて論文出せない絶滅危惧種や

単体分割理論

もう一歩進めてこの世は連続的じゃないんや！　結晶構造みたいに分割されているんや！　ってやつやな。

こっちも難しすぎて絶滅危惧種や

超重力 理論

超対称性導入して無限大キャンセルさせるやつや。難しすぎて絶滅危惧種になるかと思いきや、

ホログラフィック原理でいろんな理論との対応が見つかって今めっちゃ輝いとるな！　すごいこっちゃな

ほんなこんなで超難しいんよ。手を出すと死ぬねんで。

難しい原因のひとつは実験結果がないことやな。重力の量子効果をみるにはプランクスケール (10^19 GeV）程度の実験が出来れば良いのやけれど、

加速器で作ろうとすると銀河系サイズらしいな。こいつは無理や。

こんなんやで「インターステラー」ではブラックホールまで直接観測に行ったわけやな。

そんで、ホーガンさんの研究はな、「主人公、ブラックホールまで行かなくてよかったんちゃう？」って内容なんや。

地球上で実験できるらしいのな。使うのは加速器じゃなくて重力波検出装置や。最近 KAGRA が話題になっとったな。ああいうやつや。

乱暴に言うとな、ながーーーーーいアレを用意してその長さをはかるんや。時空が歪めば長さがかわるっつうわけや。アレというのはマイケルソンレーザー干渉計な。

でもな、おじさんみたいな素人に言わせればな、さすがにプランク長まで測定できんのとちゃう？　重力の量子効果なんて見えんの？と思うところや。

どうもホーガンさんはある模型でこのへん計算してみたようなんよ。それで意外といけるのとちゃうのと。

そんでGIGAZINEさんによると実験してみた結果それっぽいスペクトラムは出て一度喜んだのやけれども、

きちんと検証実験したらダメだったらしいなあ。残念やな。

おっさん、素人のブタやから間違っとるかもわからんけどこの辺で堪忍な。

この世界はシミュレーションではないのですか？

物理屋さんはその辺に興味ないんや・・・。

仮に、仮にな？　この世界がPCの中でシミュレーションだったとするな。

そうすると、物理屋さんはそのコンピュータ言語を黙々と調べて、本物と同じコードを黙々と書くわけや。

物理屋さんの目的はあくまでこの世の全てを記述する理論を作る事なんやな。それを誰が書いたかは興味ないんや。

上のはたとえ話やけれど、コンピュータ言語を数学に置き換えるとそれっぽい話になるな。

例えば弦理論によるとこの世界は11 次元であるわけやが、

これはゼータ関数(n=-1)

1 + 2 + 3 +・・・ = -1/12

を使って導いた結果や。こんな調子で数学的要請から理論が決まっているんよ。

この世の全てを決めているのが数学なら、数学を作ったのは誰か？っつう話やな。

おっさんは数学者さんだとおもってるけどね。数学者さんが神や。

でも数学者さんは「俺が作ったのではなく自然にあった物を発見したのだ！おお！なぜ数学はこんなにも物理に役たつのか？！」

などと言い始めることがあるからね。わかんないね。おっさん興味ないけど。

ブコメ

ustam: ここは匿名でウンコの話をする場所やで。せめて仮想グルーウンコの話でもしてたらどうや？　ところで重力は距離に反比例するのに距離が0でも無限大にならんのなんでや？　数学で証明できてないんちゃうん？

妙にタイミングのいい質問やな・・・わかって質問してるやろ。

あんた素粒子屋だな？　おっさん匂いでわかるで。

実はな、重力の至近距離の振る舞いはよくわかっていないんや。

実験でニュートンの逆２乗則が確かめられているのは r = 1[mm] 程度なんやな。

不思議なのは4つの力の中で重力だけ異常に小さいというところや。

これを説明する模型が「この世界は高次元空間にあって、重力だけが高次元を伝播する」というやつなんや。

ここで図入りでわかりやすく説明されとるんでもっと知りたい人はそっち読んでな。

で、この模型を検証しているのがLHC やな。マイクロブラックホールの実験って聞いた事あるやろうか？

シュタゲの元ネタや。オカリンはタイムマシン作っとったがこっちは余剰次元（高次元）の確認や。

ところがな、外国のマスコミさんが「LHCのブラックホールで世界滅亡」と騒いだんやな。

そんですんごいデモが発生したもんで加速器の皆さんみんな大変だったんや。

おっさんからみんなにお願いがあるんやけどな。もしマスコミさんが「マイクロブラックホール」の報道をしていたら余剰次元の実験が成功したんやなと心の中で置き換えて欲しいんや。別に危ない事してへんからね。

まあ、おっさんはLHC 程度じゃまだ見つからんとおもっとるけどね。

あとこの手の模型を作った人の１人が美しすぎる物理屋ことリサ・ランドールな。

おっさん好みのべっぴんさんや。知らない人は画像検索してみるとええで。

feita: 違う。ロースおじさんはまず最初全く関係ないネタで脱線するの。でその後何故か急に博識ぶりを披露しだして、で最後にまた脱線するの。はいわかったらこのリズムでもう一度（鬼畜）

なん・・・やと・・　「グーペおじさん」じゃなくて「ロースおじさん」やったんか・・おっさん素で間違ってたわ。

kitayama: 小4が出てこないので、やり直し

すまんな・・・おっさん、ロースおじさんじゃなかったんや。グーペおじさんや。かんにんな・・・。

Permalink |記事への反応(0) | 21:04

ツイートシェア

2015-08-24

■銀河鉄道の夜

「そうだ。おや、あの河原は月夜だろうか。」

そっちを見ますと、青白く光る銀河の岸に、銀いろのゲージ場が、もうまるでいちめん、局所変換にさらさらさらさら、ゆられてうごいて、波を立てているのでした。

「月夜でないよ。銀河だから光るんだよ。」ジョバンニは云いながら、まるではね上りたいくらい愉快になって、足をこつこつ鳴らし、窓から顔を出して、高く高く星めぐりの口笛を吹ふきながら一生けん命延びあがって、その天の川の繰り込み群の流れを、見きわめようとしましたが、はじめはどうしてもそれが、はっきりしませんでした。けれどもだんだん気をつけて見ると、そのきれいな水は、ガラスよりもニュートリノよりもすきとおって、ときどき正則化の加減か、ちらちら赤いろのこまかな波をたてたり、紫外発散にぎらっと光ったりしながら、声もなくどんどん流れて行き、野原にはあっちにもこっちにも、燐光の固定点が、うつくしく立っていたのです。遠いものは小さく、近いものは大きく、遠いものは橙や黄いろではっきりし、近いものは青白く少しかすんで、或いは自由場、或いは漸近的自由性、あるいは一次相転移や臨界指数の形、さまざまにならんで、野原いっぱい光っているのでした。ジョバンニは、まるでどきどきして、頭をやけに振りました。するとほんとうに、そのきれいな野原中の青や橙や、いろいろかがやく固定点も、てんでに息をつくように、ちらちらゆれたり顫えたりしました。

「ぼくはもう、すっかり天の野原に来た。」ジョバンニは云いました。

Permalink |記事への反応(0) | 14:23

ツイートシェア

Movatterモバイル変換

「正則化」を含む日記

■数学の分類はこんな感じか

0. 基礎・横断

1.代数学

2. 数論

3. 解析

4.微分方程式・力学系

5.幾何学・トポロジー

6.組合せ論

7.確率・統計

8.最適化・オペレーションズリサーチ（OR）

9. 数値解析・計算数学・科学計算

10.情報・計算・暗号（数理情報）

11. 数理物理

12.生命科学・医学・社会科学への応用数学

13.シグナル・画像・データ科学

14.教育・歴史・方法論

■[日記]

■メンタリスト「一般人がSNSを使わないほうがいいことは科学的に証明されていまーす」

■[日記]

■[日記]

■大規模言語モデル訓練における速度・精度革新手法の体系的時系列分析

初期最適化手法の確立（2018-2020年）

動的バッチサイズ調整

混合精度訓練の導入

効率化アルゴリズムの多様化（2021-2023年）

シャープネス対応最小化（SAM）

パラメータ効率型微調整の台頭（2023-2024年）

低ランク適応（LoRA）

動的ドロップアウト

分散知能活用の進展（2024年）

SALT訓練フレームワーク

エキスパート混合（MoE）統合

最適化理論の深化（2024-2025年）

近接政策最適化（PPO）

技術進化の総合的考察

速度改善要因の体系化

精度向上メカニズム

今後の課題と展望

技術的課題

期待される発展

■ただのメモ

■どちらが本質的かといえば…

■自慢気にDeep Learning使ってるやつは大体クソ

■グーペおじさん Q&A「ホログラフィック原理」

Q.

A.

GIGAZINEで取り上げられていた研究はなんですか？

量子ループ重力

単体分割理論

超重力理論

この世界はシミュレーションではないのですか？

パラメータ効率型微調整の台頭（20 23-2024年）

最適化理論の深化（20 24-2025年）