「死んだ」サケに様々な写真を見せて”fMRI”測定を行ったところ、死後魚類脳のいくつかの部位で、写真に反応した「神経活動」が統計的に有意に検出されました。これは、死後魚類の驚くべき認知活動を意味するのでしようか?もちろんできません。
これは単に、データ分析における「多重比較補正」を怠った結果現れた、偽陽性であることがわかりました。
結論:fMRIデータの閾値設定時に「適切な多重比較**補正**」を標準的な慣行として利用すべきです。
#
この論文は、「人々を笑わせ、そのあとで考えさせた」功績により、イグノーベル賞を受賞しました。
#
この研究の主要なテーマは、**fMRIデータ分析における多重比較補正の重要性**と、その補正を怠った場合に生じる**偽陽性の危険性**を強調することです [1-3]。
*典型的なfMRIデータは非常に多くのボクセル(約130,000個)を含むため、コントラストごとに数万回の統計テストが行われるのが一般的です [1, 2]。
* この極端な次元性により、**少なくとも1つの偽陽性が出る確率はほぼ確実**になります [1-3]。
* 適切な多重比較補正が行われないと、誤った結果(偽陽性)が報告される可能性が高まります [1, 2, 4]。
* 多くの研究者が未補正の統計量を使用しており、p値の閾値を厳しくしたり(例: p < 0.001)、最小クラスターサイズを設定したりする方法に頼っていますが、これは多重比較問題への不適切な対処法であり、原理に基づかないアプローチだとされています [5, 6]。
* **目的**: この研究は、多重比較補正を無視することの危険性を示すために、**死んだタイセイヨウサケを被験者としてfMRIスキャンを実施**しました [1, 3, 6, 7]。
* **方法**:
サケは、人間が社会的な状況にいる写真のシリーズを提示されるという、**開かれた精神化課題**を与えられました [18]。これらの写真は、社会的に包摂的または排他的な、特定の感情的価数を持っていました [18]。サケは、写真の中の人物がどのような感情を経験しているかを判断するように「求められました」 [18]。これは、後に人間の被験者グループにも実施されたのと同じ**社会的視点取得タスク**でした [2]。
刺激はブロックデザインで提示され、各ブロックは4枚の写真がそれぞれ2.5秒間(合計10秒間)提示され、その後12秒間の休憩が続きました [18]。合計12ブロックの写真提示が完了し、ラン中に48枚の写真が提示されました [18]。タスクの総スキャン時間は5.8分で、140の画像ボリュームが取得されました [18]。画像取得には1.5テスラGEシグナMRスキャナーが使用され、クアドラチャーバードケージヘッドコイルがRF送受信に用いられました [17]。サケの動きを制限するためにヘッドコイル内にフォームパッドが配置されましたが、被験体の動きが非常に少なかったため、ほとんど必要ありませんでした [17]。
* **結果**:
* **未補正の統計量(p < 0.001)では、サケの脳腔と脊柱に活動的なボクセルクラスターが観察されました** [1, 9-11]。そのクラスターサイズは81mm³で、クラスターレベルの有意性はp = 0.001でした [10]。
* **多重比較を補正した統計量(家族全体のエラー率 (FWER) と偽発見率 (FDR))では、緩和された統計的閾値(FDR = 0.25およびFWER = 0.25)であっても、活動的なボクセルは全く存在しないことが示されました** [1,10]。
* **結論**: このデータは、**EPI時系列のランダムなノイズが、多重テストが制御されない場合に誤った結果を生み出す可能性がある**ことを示唆しています [3]。
* **FWER(家族全体のエラー率)**:複数の有意性検定を行った後に、1つ以上の偽陽性を観察する確率を制御します。例えば、FWER = 0.05は、仮説テスト全体で1つ以上の偽陽性が出る可能性が5%であることを意味します [12]。Bonferroni補正が最もよく知られたFWER制御法ですが、fMRIデータには保守的すぎることがあり、真のシグナルを排除してしまう可能性があります [11-14]。fMRIではガウスランダム場理論や順列法が主に用いられます [12]。
* **FDR(偽発見率)**: 検出された結果のうち、偽陽性であると予想される割合を制御します。例えば、FDR = 0.05は、検出された結果の最大5%が偽陽性であると予想されることを意味します [10, 13]。FDRはFWERよりも保守的ではありませんが、統計的検出力と多重比較制御のより良いバランスを提供します [13, 15]。
* これらの補正方法は、主要な神経画像処理ソフトウェアパッケージ(SPM、AFNI、FSLなど)にすべて含まれており、**適用することは難しくありません** [4, 15, 16]。
*論文は、**fMRIデータの閾値設定時に適切な多重比較補正を標準的な慣行として利用すべき**であると主張しています [1, 4]。
*研究者は、統計的検出力の低下を懸念して補正を避ける傾向がありますが、**未補正の統計量を使用し続けるという選択肢はあってはならない**と述べています [4]。
* 多重比較問題は「非独立性エラー」(クラスター内のボクセルが同じ統計的尺度で選択された場合の統計的推定値のインフレ)や、時系列自己相関、低周波ドリフトといった他の統計的問題とは区別されるべきです [17]。
https://www.sciencedirect.com/science/article/abs/pii/S1053811909712029