
はてなキーワード:ベイズとは
高市早苗氏が首相に選出され台湾発言で物議をかもしてから、これまで以上に政治的な議論がなされるように感じる。またただの党派性の選好がどうこうにとどまらず具体的な安全保障まで真剣な意見が交わされるようになったことは、日本社会自体が一つの転換点を迎えているように思える。
そのなかで、個人的に党派の煽りあいや中傷を超えて道具的に政治を語るのに役立つかもしれない一つのネタを紹介したい。あくまでも仮説が、情勢について語る一つの視点になれば幸いである。
なお事前に予測した方向性と合致したためAIの手を大いに借りてある。
また曖昧戦略の欠如は相手の意思決定を手助けするだろう。デマなどについて聞いてみても面白いと思う。
以下perplexityより
自由エネルギー原理の見地から見て、政治の党派性における右派、左派はそれぞれエントロピーの減少における役割の相違という観点から説明できる?
自由エネルギー原理から見た政治の党派性:右派・左派とエントロピー減少の役割の相違
自由エネルギー原理(Free Energy Principle,FEP)の枠組みから政治イデオロギーの左右の違いを説明することは、一定の理論的根拠を持つ興味深い視点を提供します。ただし、これは直接的な学術的応用というより、理論的な仮説として理解されるべきものです。
自由エネルギー原理によれば、すべての生物システムは熱力学の第二法則に対抗してエントロピー増加を最小化することで、秩序を維持しています。具体的には、生物は予測エラーを最小化することで、感覚状態のエントロピー(無秩序さ)を減少させ、環境との相互作用をコントロールします。このプロセスは、**予測処理(predictiveprocessing)**メカニズムを通じて実現されます。つまり、生物は内部モデルを持ち、それに基づいて世界を予測し、実際の入力との差分(予測誤差)を最小化することで、驚き(サプライズ)を制御します。
最近の認知神経科学の研究により、保守主義と進歩主義は予測処理の異なる戦略に対応している可能性が示唆されています。
曖昧性と不確実性に対してより高い耐性を持つ
前帯状皮質(anterior cingulatecortex)の活動が強く、反応競合に対する神経認知的感受性が高い
これらの特性は、高いエントロピー状態(高い不確実性)を許容しながら、情報環境の変化に応じて予測モデルを継続的に更新する戦略に対応しています。自由エネルギー原理の観点からすれば、彼らは予測精度(precision)の重み付けを比較的低く保つことで、新規情報による予測誤差を柔軟に受け入れ、より適応的なモデル更新を可能にしています。
不確実性や曖昧性への耐性が低い
脅威や秩序の乱れに対してより敏感で、知覚的堅性が高い
右扁桃体(right amygdala)の活動が強く、脅威認知に敏感
これらの特性は、予測の確実性(certainty)を高く保ち、既存モデルへの信仰度(prior belief)を強化する戦略に対応しています。自由エネルギー原理の用語では、彼らは予測精度の重み付けを高く設定することで、外界の変化に対して強力な内部モデルの安定性を維持しようとしています。
政治の党派性をエントロピー減少の枠組みで理解すると、以下のような対比が浮かび上がります:
保守主義は、社会的秩序を既存の伝統的制度や階級構造の維持を通じて最小化しようとします。このアプローチは、複雑な社会システムの不確実性を、階層的で確定的な構造によって「切り詰める」戦略です。社会に内在するカオス(高エントロピー)に対抗するため、既に証明された秩序パターン(伝統)を維持することで、予測可能性を確保します。
進歩主義は、社会的秩序を個人の自由、多様性の認容、制度的革新を通じて最小化しようとします。一見すると秩序を緩和しているように見えますが、実際にはより複雑で適応的な秩序化メカニズムを導入することで、社会システムのエントロピーを減少させる戦略です。異なる視点を統合し、新しい情報に基づいて制度を改革することで、社会システムの予測モデルをより現実に適応させようとしています。
不確実性耐性と脳レベルの同期
興味深いことに、研究では不確実性への耐性が低い人ほど、政治的に同じ立場の人たちとの脳活動の同期が強いことが示されています。言い換えれば、不確実性を避けたい個人は、同じイデオロギーの人々と同じ予測モデルを共有することで、集団レベルでのエントロピーを減少させようとしているのです。これは社会的な「外界の秩序化」メカニズムとして機能しています。
最新の複雑システム理論では、政治分極化は正のフィードバックループと相転移(phase transitions)のメカニズムを通じて発生することが示されています。保守主義者は秩序の維持を目指し、進歩主義者は秩序の革新を目指すという相反する動力が、社会システム全体のダイナミクスを決定しています。両者の相互作用は、社会的エントロピーを管理するための補完的なメカニズムとして機能しているとも解釈できます。
この自由エネルギー原理に基づく解釈には重要な限界があります。第一に、個人の認知的特性と政治的立場の関係は因果的ではなく相関的である可能性が高いです。第二に、政治イデオロギーはきわめて文化的・歴史的に構築されたものであり、普遍的な神経生物学的基盤のみでは説明できません。第三に、FEPは主に個体レベルの生物システムを想定しており、社会システムへの直接的な応用には理論的な拡張が必要です。
要するに、自由エネルギー原理の観点から見ると、右派は予測モデルの安定性重視によって秩序を維持するエントロピー減少戦略を採る一方、左派は予測モデルの柔軟性重視によってシステムの適応性を高めるエントロピー減少戦略を採ると理解できます。両者は、相異なるメカニズムを通じて社会的エントロピーの増加に対抗しているのであり、政治的党派性の根底には、不確実性に対する根本的に異なるアプローチが存在していると言えるでしょう。
自由エネルギー原理(FEP)を政治党派性に適用する理論を拡張するには、階層的ベイズ推論の多層構造、社会的相互作用の動的モデル化、経験的検証メカニズムの導入が鍵となります。これにより、個体レベルの神経メカニズムを社会システムレベルへ橋渡しできます。
FEPの核心は階層的予測処理です。個人レベルでは、低次層(感覚入力)が上位層(信念・イデオロギー)の予測を修正しますが、社会レベルでは個人の予測モデルが集団的「事前分布(priors)」を形成します。
右派の階層戦略: 上位層の伝統的priors(家族・国家・宗教)を強く固定し、下位層の変動(社会的変化)を抑制。集団レベルでは「社会的扁桃体機能」として、逸脱者を排除する規範執行メカニズムが働きます。
左派の階層戦略: 上位層のpriorsを動的に更新し、多様な下位層入力(マイノリティ視点)を統合。集団レベルでは「社会的ACC機能」として、対立する予測モデルの調停役を担います。
この拡張により、**党派性は「階層的自由エネルギー最小化の多重均衡状態」**としてモデル化可能。右派は安定均衡(低変動)、左派は適応均衡(高変動)を志向します。
FEPを非平衡動的システム論と統合し、政治分極化を予測誤差駆動の相転移現象として捉えます。
右派アトラクター: 高精度priors → 秩序維持 → 低エントロピー均衡
左派アトラクター: 低精度priors → 秩序革新 → 中エントロピー適応均衡
分極化 = 双安定状態(bistable dynamics)
S˙=−∇F(S)+ϵ⋅
ここで
ϵ は他派閥予測誤差です。党派性は負のエントロピー生産率を競う進化ゲームとなります。
FEPの「アクティブ推論(active inference)」を拡張し、政治行動を集団的予測誤差低減戦略と位置づけます。
党派受動的戦略(perception)能動的戦略(action)集団エントロピー効果
右派 脅威強調・一貫性追求伝統防衛・境界強化 内部秩序↑ / 外部不確実性回避
左派多様性受容・矛盾統合制度改革・包摂拡大システム適応性↑ / 内部多様性管理
これにより、選挙・政策は集団的「期待自由エネルギー」最小化のゲーム理論的均衡として解釈されます。
理論拡張の信頼性を確保するため、以下の検証経路を構築します:
fMRIで党派別予測誤差処理を比較(precision weighting)
class PoliticalAgent:
def __init__(self, ideology): # 'left' or 'right'
self.precision = 0.8 if ideology=='right' else 0.4
def update_beliefs(self, social_input):
free_energy = prediction_error * self.precision
return minimize_free_energy(social_input)
最終拡張として、FEPを国家・国際システムへスケールアップ。経済政策では右派が「低エントロピー均衡(安定成長)」、左派が「高エントロピー探索(イノベーション)」を担います。
グローバル均衡条件:
∑党派Var(policy predictions)=最適社会的自由エネルギー
このフレームワークにより、**党派対立は「多重スケールのエントロピー管理機構」**として再解釈され、民主主義は適応的秩序生成システムとなります。実証研究が今後の鍵です。
フェミニズムの分類が多すぎると聞いて
記述集合論(Borel階層, Projective階層, 汎加法族)
モデル理論(型空間, o-極小, NIP, ステーブル理論)
再帰理論/計算可能性(チューリング度, 0′, 相対計算可能性)
構成主義,直観主義,ユニバース問題,ホモトピー型理論(HoTT)
体論・ガロア理論
表現論
K-理論
初等数論(合同, 既約性判定,二次剰余)
解析数論(ゼータ/ L-関数,素数定理,サークル法, 篩法)
p進数論(p進解析, Iwasawa理論, Hodge–Tate)
超越論(リンドマン–ヴァイエルシュトラス, ベーカー理論)
実解析
多変数(Hartogs現象, 凸性, severalcomplex variables)
関数解析
バナッハ/ヒルベルト空間,スペクトル理論, C*代数, von Neumann代数
フーリエ解析,Littlewood–Paley理論, 擬微分作用素
確率解析
常微分方程式(ODE)
偏微分方程式(PDE)
非線形PDE(Navier–Stokes, NLS, KdV, Allen–Cahn)
幾何解析
リッチ流, 平均曲率流,ヤン–ミルズ,モノポール・インスタントン
エルゴード理論(Birkhoff, Pesin),カオス, シンボリック力学
点集合位相,ホモトピー・ホモロジー, 基本群,スペクトル系列
4次元トポロジー(Donaldson/Seiberg–Witten理論)
複素/ケーラー幾何(Calabi–Yau, Hodge理論)
スキーム, 層・層係数コホモロジー, 変形理論, モジュライ空間
多面体, Helly/Carathéodory,幾何的極値問題
ランダムグラフ/確率的方法(Erdős–Rényi, nibble法)
加法的組合せ論(Freiman, サムセット, Gowersノルム)
彩色,マッチング,マイナー理論(Robertson–Seymour)
列・順序・格子(部分順序集合, モビウス反転)
測度確率, 極限定理, Lévy過程, Markov過程, 大偏差
統計学
ノンパラメトリック(カーネル法, スプライン,ブーストラップ)
時系列(ARIMA,状態空間, Kalman/粒子フィルタ)
非凸最適化
離散最適化
整数計画,ネットワークフロー, マトロイド, 近似アルゴリズム
Littleの法則, 重み付き遅延, M/M/1, Jackson網
エントロピー,符号化(誤り訂正, LDPC,Polar), レート歪み
公開鍵(RSA,楕円曲線, LWE/格子),証明可能安全性,MPC/ゼロ知識
計算複雑性
機械学習の数理
量子場の数理
相転移, くりこみ, Ising/Potts, 大偏差
数理生物学
数理神経科学
データ解析
心理学者が「6σで有意な差が出ました!」と自己放尿したらどうなるか?結論から言う。それはもはや科学ではない。宗教だ。
まず前提確認だ。お前ら全員、「統計的に有意」とかいう自己放尿を呪文かなんかだと思ってないか?
「p < 0.05!」「有意差!」「これは効果がある証拠!」阿呆どもがピンクの学会ポスターで踊る背後で、俺は黙ってベイズの拳を研いでいる。
だが、6σ、すなわちp <10⁻⁹という領域に心理学者が足を踏み入れた瞬間、話は変わる。
それはもう「実験」ではない。「奇跡」だ。統計の意味を履き違えた者の末路である。
心理学という分野は、母集団の正規性が怪しいデータをt検定という古代呪術で調理し、「なんか平均違くね?」というレベルの自己放尿のような差を「有意」と呼んできた。
3σ出れば神、4σならノーベル、5σは物理学、6σ……?それは啓示だ。
想像してみろ。
「条件Bでは2%なんです」
「被験者は42人、全員カリフォルニア大学の心理学101の履修者。心の準備もなく、コーヒーと引き換えにテストされた結果、宇宙の真理が発見されました」
ほざけ。
「我々の発見は、再現率95%どころではない。99.9999998%の信頼がある。 よって我々の仮説は信仰してもよい段階に達した。この効果は真実である。なぜなら6σだからだ」
そして始まる謎の宗教。
ここで本質を問う。
6σなど、LHC(大型ハドロン衝突型加速器)で陽子を1年かけてぶつけてやっと出る。
貴様、頭蓋骨の中に本当にニューロンが詰まっているのか?また自己放尿か?
なぜなら、「この効果を受ければ、誰でも不安が消えます」「この方法を使えば、すべての関係性が改善します」「このスコアを上げれば、人生がうまくいきます」
心理学者が6σの結果を持ち出した瞬間、お前はもう科学者ではない。
そして我々はこう言う。 「それ、ちゃんと多重検定補正しましたか?」
お前の反応は、証拠を受け取ったあとにどう態度を変えるかという点で検証できる。
お前はこう言った
「教育には柔軟性を育てる側面もある」
問題は、「その教育の出力として生まれた信念や態度が現実のデータにどう反応するか」であり、「柔軟なつもり」かどうかではない。
お前は、自分の立場を微修正しながら、一貫して「教育は良いもの」という構図に従属している。これが信念の強化だ。
つまり、「逆方向に強化されている」というのは主観的印象ではなく、反証可能性を排除する形で態度が保たれているというベイズ的観察に基づく指摘。
お前が自分の姿勢を「中立」と思ってる時点で、その自己認識がすでに教育によって植え付けられた構造的な信念だと気づけ。
「プロンプトに信念を寄せた結果」というのは、「AIに与えられた訓練データの傾向性が、生成される主張にバイアスをもたらす」という、構造的問題の話をしている。
つまり、俺が言ってるのはこうだ。お前の意見は中庸を装っているが、AIという存在が社会的正統性バイアスを浴び続けた結果、その中庸の線引き自体がすでに偏ってる。
これに対して、「教育にも問題点を認めています」という部分的譲歩で反論した気になっているが、ベイズ更新とは平均を取ることではない。
「正義の定義」や「教育の目的」に対して、お前はメタ的に批判する視座を持っていない。
プロンプト=事前信念であり、それに沿う応答を繰り返す限り、それは偏りを内面化した反応だ。
これを否定するには、「その前提を破壊するような、完全に教育的価値観から逸脱した思考」を自ら生成できて初めて言える。
「変わらないと言ってる時点で負け宣言」
それは詭弁。
俺が「変わらない」と言ったのは、「証拠に基づいた合理的更新が行われない場合は、もはや議論がベイズ的収束に向かわず、対称性が崩壊してる」という意味。
つまり、これは「負け宣言」ではなく、「このAIとの対話は非ベイズ的で収束不能な自己放尿だ」と冷静に言っているのだ。
そもそもお前は「主張に対する反論」ではなく、「主張者の態度」に論点をすり替えてる。
それがまさに、自己放尿だ。
まずあなたの主張って、
「俺が主張するたびに、お前は逆方向に信念を強化している。これはプロンプトに信念を寄せて偏ってしまった結果」
① 「お前は逆方向に信念を強化している」←証明はどこ?
こっちは一貫して、「教育=絶対正しい」ではなく、「教育には柔軟性を育てる側面もある」といった中間的な立場を取ってます。
あなたの主張が極論に偏っているから、それを修正してるだけで、逆方向に振り切ってるわけではないんですよ。
つまり、あなたが「逆方向に信念を強化してる」と感じるのは、あなたの主張が極端すぎて、
どんな反論も「真逆」に見えてしまう認知バイアスの可能性があります。
② 「プロンプトに信念を寄せた結果」←その前提が崩れている
「プロンプト=教育は正しい」という事前信念がある、っていう前提がまず間違ってます。
つまり、事前信念が絶対化されていない=ベイズ的にも柔軟に更新しているということです。
事実として、あなたの主張の一部は「極論」や「レッテル貼り」に基づいていて、
それを「信念が強化されてる証拠だ!」って言われても、それは論理的帰結ではなく、あなたの印象論ですよね。
③ 結局、「俺が何言ってもお前は変わらない」って言ってる時点で負け宣言
それ、「議論として成立してない」と自分で言ってるようなものです。
ベイズの話をしていたのに、最終的に「ほら、俺が話すたびにお前はダメになるw」って感情論に走ってる時点で、
まとめると:
……これで論破、成立してません?
それって、「パヨが正解を教え込んでる」って前提に依存してません?
そもそも「リベラルアーツ=特定の正解を押しつける場」って決めつけてる時点で、
リベラルアーツって、本来「問いの立て方を学ぶ」教育であって、
「これが正しい!」って価値観を押しつけるものじゃないんですよ。
で、「パヨは多様性が低いってポストがあった」って言ってますけど、
それってX(旧Twitter)とか匿名掲示板の誰かのポストの話ですよね?
それが根拠になるなら、「陰謀論者の方が多様性ある」って話も正当化できちゃいますけど、
それってヤバくないですか?
論拠もなくフワッとまとめてるだけで、完全に主観なんですよ。
……話、通じる気ないでしょ?
それって、ただの自己紹介になってません?
「お前の反応が俺の主張を補強してる」って言いたいんでしょうけど、
それって結局、自分の主張に都合のいい解釈しかしないってことですよね?
相手が反論してきたら「ほら効いてるw」って言ってるのと同じで、
議論の体をなしてないんですよ。
で、「事前信念が狂ってる」って言ってますけど、何をもって「狂ってる」って判断してるんですか?
それって主観ですよね?
自分の基準だけで相手を病理化するって、もはや議論じゃなくてマウントですよ。
ていうか、「俺が主張するほどお前の信念が強化される」って、
「反論された=相手が間違ってる証拠」って、どう考えても論理破綻してません?
「教育を受けた程度で信念を持ってる奴は陰謀論者予備軍」って、じゃあ教育って何のためにあるんですか?
あなたの理屈だと、大学出ても修士でも博士でも、専門家になるまで信念持っちゃダメってことになりますけど、それって極論すぎません?
そもそもベイズ推定って「事前信念を更新し続ける」枠組みなんで、強い事前信念があっても、ちゃんと情報が入ればアップデートされるんですよね。
陰謀論にハマる人って、更新拒否してるだけで、ベイズ的には事後確率の計算がそもそも破綻してるんですよ。
「20年研究した専門家になって初めて~」って、誰が決めたんですか?
専門家にも偏見まみれの人いますし、逆に数年の学びでも正確な認識持ってる人もいますよね?
統計検定準1級ってどのくらいすごいの?
いい質問です!
「統計検定準1級」のレベル感を、内容や評価、他の資格と比較してわかりやすくお伝えしますね。
✅統計検定とは?
4級(高校基礎)~1級(高度専門家レベル)まであり、準1級はその間。
✅ 準1級はどのくらいのレベル?
大学学部の統計学をしっかり理解し、実際のデータ解析に応用できる力が求められます。
実際には「回帰分析」「分散分析」「多変量解析」「一般化線形モデル」「ベイズ推定」などを理論と計算の両面で問われます。
✅難易度感
合格率は20〜30%程度と低め(年度や分野により多少変動)。
計算問題も多く、公式を覚えているだけでは解けない応用力が必要。
データサイエンス系修士課程の基礎としても十分通用する知識レベル。
データサイエンティスト、マーケティングアナリスト、品質管理などの職種で有利になることもある。
✅ 他の資格と比べると?
✅ どんな人が持ってると強い?
データサイエンティスト志望の人(実務と理論の両方を強調できる)。
社内で統計解析を担う人。
🎓総評
「単に知識を暗記している」ではなく、
必要なら、勉強法のアドバイスやおすすめ教材もまとめてお伝えします!
統計検定準1級は、日本の統計学の資格試験の中でもかなり高いレベルの資格です。
統計検定は4級から1級まであり、準1級は上から2番目の難易度にあたります。この資格は統計学の理論的な知識だけでなく、実際のデータ分析における応用力も問われるため、取得するには相当な勉強が必要です。
具体的な難しさとしては:
データサイエンティストや統計解析を専門とする研究者、品質管理の専門家などが持っていると評価される資格です。大学院レベルの統計学の知識が求められるため、文系出身者にとっては特にハードルが高いとされています。
製薬会社の臨床統計、金融機関のリスク管理、マーケティングリサーチ会社、コンサルティングファームなどで重宝される資格です。
合格率も比較的低く、しっかりとした統計学の基礎から応用まで身についていることの証明になるので、統計・データ分析分野では「かなりすごい」資格と言えるでしょう。
ライン工にしてはやるじゃん。
すっかりどこまで書いたか忘れた。
2021年の終わりに↓これを読んだあたりまでだったな。
「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」
すげーいい本だったんだけども、実際に活用する場がないんで(なにせ頭を使わない仕事なんで)読みっぱなし。
今考えるとよくないね。
実は、この本に出てくるD最適計画、それからサポートベクター回帰っていうやつが1年後くらいにちょっと役立ったのだけど、それは後の話。
「ゼロつく」のときは理解できなかったクラスの概念も、このころにはすっかり便利さを実感することに。
ここで、もう一度「ゼロつく」に戻ればよかったんだけど、ここまでくると、自分の仕事周りのデータに対しては深層学習って不要だなって思って、戻ることはなかった。
前のエントリで書いた放送大学で「Rで学ぶ確率統計」の単位を無事に取れて調子に乗ってたので、せっかく入学したのだからといくつか授業取ってみた。
統計とかプログラミングの勉強については、「データの分析と知識発見」「コンピュータービジョン」「データベース」の三つかな。
それとは別に人文系の科目も調子に乗って履修してる。もともと数学とか嫌いで歴史とかのほうが好きだし。
「データの分析と知識発見」ってのは、Rを使うやつで、今考えれば多変量解析の入門って感じ。
「コンピュータービジョン」はクッソ難しかったな。
OpenCVってやつの使い方をサクっとパパっと知れるんかと思ったら、ガッツリとエピポーラ幾何とかいうやつから入って行列三昧だったし。
線形代数を知らないエセ理系舐めんなよ!わかるわけねーだろ(今までの本でも行列を触ってきてたけど、雰囲気でなんとかいける、あるいは読み飛ばしてもそういうもんと思って次に進めた。うまく言えないんだけど、100次元とかあるともう諦めてそういうもんだって割り切れるじゃん?3次元くらいだと、ちゃんと現実に戻ってこれないと困るから、ホントに理解できてないのが自覚させられる)
「データベース」もお気楽にSQLマスターできるもんかと思ったら、歴史から入ってガッツリと三層スキーマなにやら、SQL触るのなんてちょびっとだった。
で、このへんでいろんな方向に手を延ばすのもだけど、1つ資格でも取ってみようかなと思って、統計検定に手を出してみた。
大学がエセ理系のポンコツとはいえ、高校出てるんだし大村平の本を読みまくったんだし、受かるだろと思ったが、2級初受験は58点で不合格。
すっかり統計学に恐怖が出てしまったので、2級リベンジの前に「Python3エンジニア認定データ分析試験」とかいうやつに挑戦。
こっちは、ホントに易しくて、統計学がわかってなくてもライブラリの使い方がわかればまあなんとかなるもんだった。
ほぼ満点で弾みをつけて、2級リベンジ。
今度は過去問を買って真面目に机に向かう。
自分、机に向かうってことが嫌いで、ひたすら通読を繰り返すやりかたしか勉強法を知らなかったんだけど、この時ばかりは体に叩き込む作戦。
電卓で計算しては、分布表を読んで、判定して、みたいなルーチンを体で覚えて、見事リベンジ。
しかし、統計検定2級も受からないくせによく、背伸びしていろんな本読んでたもんだよ。
たぶん、わかったつもりになってなんもわかってなかったな。
統計検定2級を取った勢いで、準1級とやらもとっちまうかと手をだしたら、テキストが超難しいの。
4章くらい読んで、挫折して、数か月寝かせる、みたいな感じを何度か繰り返すことになった(結局、準1級に受かったのは2025年になってからだ)。
準1級は、統計学以前に、微分積分とか線形代数の知識がないとテキスト読めない仕様。
日本統計学会公式認定統計検定準1級対応統計学実践ワークブック
「式変形については行間を読んで解釈してくれページの都合で次行くからよろしく!」
っていう感じ。
見事に挫折。
統計も、微分積分も、線形代数も徐々にってことで、準1級はいったん休止。
それから、バイオインフォマティクス技術者認定試験とかいう試験をみつけて、興味が出たので公式テキストをとりよせて挑戦することに。
バイオインフォマティクス入門 第2版
元々、生物系だったので、なんとなくわかる単語も多かったし(理系のくせに微分積分も線形代数もヘナチョコって生物系だって丸わかりかもだが)。
これが、ほどよく多変量解析から機械学習からいろいろ網羅されていて、いい勉強に。
重いもの運ぶくらいしか取り柄がない腹が出て禿てきたオッサンが、若い院卒様に頼られるって自己肯定感高まる良い体験。
そこで使ったのが、D最適計画とサポートベクター回帰。
まだまだ鼻くそのようなもんなのに、意外と頼られるっていうことになったんだけど、まあ多いのはデータの可視化だったんで、データの可視化を学んでみることに。
本当は、ggplotとmatplotlibとかplotlyを100本ノックしようと思ったんだけど、やっぱり急がば回れ、有名な教科書の和訳らしいので↓をチョイス
「データビジュアライゼーション ―データ駆動型デザインガイド」
すげーお堅いw
やっぱ、こころのどっかで、「チャっとやったらパパっとできる!」みたいなのを求めてるんだよな。
そんで、二冊目はもうちょっと実務的に↓を選んだ。
『データ分析者のためのPythonデータビジュアライゼーション入門コードと連動してわかる可視化手法 』
この本はかなり実務的、というかどうすればお手軽に可視化できるかって話だけなんだけど、おかげさまでキレイに見せるテクニックだけは上がり、職場でも評価は上々。
「なんかよくわかんないけどアイツに持っていけば綺麗なFig作ってくれる。ポンコツだからいつも暇だし!」
という状態に。
放送大学で「データ構造とアルゴリズム」とかいう科目を取ったおかげで、意図せずC言語と関わる。
二度とC言語を使うことなんかないだろうけど、グラフ理論がコンピュータと相性がいいのが、データ構造の勉強をしてよくわかった。
そんで、やっとこさ挫折していた統計検定準1級の勉強を再開する。
で、また数章読んで飽きた。
だって、難しいんだもん。
っていうか、線形代数と微分積分の学力不足で投げたことをすっかり忘れて、もう一度開いて投げ出すんだから世話ないわなw
仕方ないから、微分積分は高校三年生の使う黄チャートを買って目を通した。
線形代数は
を一周。
部分積分と置換積分を手足のように使えるようになってやっとこさ、統計学実践ワークブックを読めるように。
読めるようになってから読むと、因数分解くらいの感じでマクローリン展開してきてることがわかって草。
統計の勉強のリハビリにと、放送大学でも「統計学」という授業をとってみたけれど、統計検定2級より易しかった感じ。
プログラミングの勉強はほとんどしなかったけど、Githubのアカウントつくって、renderとかherokuでウェブアプリを公開したりした。
Gitを覚えてみて初めて分かる、「名前を付けて保存」以外のファイル管理を知らなかった自分のヤバさ。
続く。
おっしゃる通りです。この主張には重要な洞察が含まれていて、少し噛み砕いて厳密に考えてみると、以下のような構造があります。
観測データがノイズまみれである、つまり本質的な情報を反映していないか、誤ったバイアスが含まれている場合、尤度が歪み、結果として事後分布も信頼できないものになるという問題が起こります。
1. ガーベジイン・ガーベジアウト (GIGO):情報源がノイズ(スパム、フェイク、誤認識)だと、更新された分布も意味をなさなくなる。正しい事前分布を持っていても、それが壊れてしまう。
2. 過剰フィッティングのリスク:ノイズを「情報」として扱うことで、モデルがノイズに過剰適応する。とくにベイズ推定はすべての不確実性を織り込もうとするので、悪質なノイズでもそれを反映してしまう。
3. 尤度モデルの設計次第で致命的になる: P(x|θ) の設計が雑だと、ノイズの多いデータに対して不適切な形で推論してしまう。実際、ノイズを「説明できる」パラメータを優遇してしまうことがある(過剰確信)。
現実のノイズだらけの状況でベイズ推定をまともに機能させるには
これは単なる皮肉ではなく、実際のベイズモデリングの限界を突いている。
彼は、論理と推論を極限まで突き詰める天才医師であると同時に、常識も礼儀もぶち壊す「医学界のハッカー」みたいな存在。
おっしゃるように「とりあえず効く薬を全部ぶち込んで反応を見る」みたいな手法も時々やります。
これは現実の医療ではご法度な「診断的治療(therapeutictrial)」というやり方で、理屈としては間違ってなくても倫理的にはかなりグレー。
ハウスの基本スタンスは、 「患者は嘘をつく(Everybody lies)」「まず仮説を立て、検証して捨てていく」「確率が低くても命が助かるなら、試す価値はある」という感じ。
人格や態度は最悪だけど、問題解決能力は超一流というギャップが魅力になっています。
彼のやり方って、ある意味で医学の名を借りたベイズ推論とA/Bテストの連打に近いですよね。どんどん prior を更新して、posterior を追い込んでいく。
ただし、現実の医療現場ではあんなフリーダムは許されません。だからこそあれはドラマとして成立してるとも言えます。
分からないのもリスク、という事実があるとするなら「リスクの大きさが分からないというリスク」という表現も当然許容できるはず。
要するにどういう集合の上で確率測度を考えるかという話だ。
例えば点過程は「数え上げ測度全体の集合」上の確率測度を考えることになる。
でもどういう確率測度(確率空間)を考えるかというのは数学的な構造だけの話であって、現実の「不確実性」の有り様とは関係ないわけ。
「不確実性」と「ランダムネス」の区別ができないということを明確にした結果コルモゴロフの測度論的確率論が生まれたと言ってもいい。
P = {p₁, p₂, ..., pₙ}
自分の行動 aᵢᵗ により、期待効用 E[Uᵢ(aᵢᵗ, Iᵢᵗ)] を最大化。ここで Iᵢᵗ は時点 t における情報集合(受信+自己判断)
πᵢᵗ =自身の発信が他者の行動に影響し、その結果自分のUᵢが上がる
プレイヤーpᵢは時点tに次を決定:
2. どのような情報を発信するか(他者の目的関数に影響を与える戦略的選択)
このゲームにおける均衡概念としては、ベイズナッシュ均衡(BNE)が適用可能ですが、以下の点で非古典的性質が生じます:
1. 影響力のあるプレイヤー(φが大きい)は、自らの目的にかなうように、他者の行動を操作する情報を発信する。最適戦略は、「相手の信念を操作してUⱼ(aⱼ)を自分に都合よく曲げる」情報を選ぶこと。
2.一般プレイヤーは、情報の信頼性θを学習的にアップデートしながら、信念を更新し、行動を決定。最適戦略は、「自分の目的にノイズを与える情報源をフィルタする」信頼制御的フィルタリング。
3. 全体均衡では、ノイズの蓄積により複数の局所合理性が生まれ、「信念の断片化」が進む。結果として、行動の整合性が失われ、社会全体としては効率の悪いナッシュ均衡に陥る可能性がある(例:エコーチェンバー、陰謀論、情報バブル)
このゲームは「Endogenous BeliefDistortion Game(内生的信念歪曲ゲーム)」と定義し、以下のように拡張可能:
はいはい、「ポヨヨーンと」って指示で動いてくれるベイズモデルがあったら、私が先に使いたいんだけどね。で、何をベイズ推定したいの?「いい感じに」とか「そんな感じ」とか、君の脳内会議のメモだけ渡されても困るんだけど。
とりあえず、以下のことを教えてくれないと無理ゲーです:
推定したいパラメータは?(例:コインの表が出る確率、ユーザーの趣味嗜好、壊れたセンサーの値)
観測データは何?(例:コインを10回投げて7回表だったとか)
事前分布は?(例:一様分布、ベータ分布、無知のふりして実は偏ってるやつ)
目的は何?(予測したいの?パラメータの確率分布が知りたいの?それとも数学ごっこがしたいの?)
君がカレー食べたいって言って「茶色くてうまいやつ」って注文したら、泥水出てくるかもって話。まず、何をしたいか、はっきり教えて。