Movatterモバイル変換


[0]ホーム

URL:


跳转到内容
维基百科自由的百科全书
搜索

司徒頓t檢定

本页使用了标题或全文手工转换
维基百科,自由的百科全书

司徒頓t 檢定(英語:Student'st-test)是指虛無假說成立時的任一檢定統計有司徒頓t分布統計假說檢定,屬於母數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本期望值是否為某一實數,或是二(两)群來自常態分配母體的獨立樣本期望值的差是否為某一實數。舉個簡單的例子,在某個學校中我們可以從某個年級中隨機抽樣一群男生,以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值。

由來

[编辑]

司徒頓t檢定是威廉·戈塞為了觀測釀酒品質於1908年所提出的,「司徒頓 (student)」則是他的筆名[1][2][3][4]基於克勞德·健力士(Claude Guinness)聘用從牛津大學劍橋大學出來的最好的畢業生,[2]以將生物化學及統計學應用到健力士工業流程的創新政策,戈塞受雇於都柏林的健力士釀酒廠擔任統計學家。戈塞提出了t检验以降低啤酒重量监控的成本。戈塞於1908年在《Biometrika英语Biometrika》期刊上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名,統計學論文內容也跟釀酒無關。實際上,其他统计学家是知道戈塞真實身份的。

應用

[编辑]

常見的應用有:

  • 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
  • 獨立樣本t{\displaystyle t} 檢定(双样本):其零假设为两个正态分布的总体的均值之差為某實數,例如檢定二群人之平均身高是否相等。若两母體的變異數是相等的情况下(同質變異數),自由度為兩樣本數相加再減二;若為異質變異數(母體變異數不相等),自由度則為Welch自由度,此情況下有时被称为Welch检验。
  • 配对樣本t{\displaystyle t} 檢定(成對樣本t{\displaystyle t} 檢定):檢定自同一母體抽出的成對樣本間差异是否为零。例如,檢测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸將縮小。
  • 检验一迴歸模型的偏迴歸係數是否显著不为零,即檢定解釋變數X{\displaystyle X} 是否存在對被解釋變數Y的解釋能力,其檢定統計量稱之為t-比例(t-ratio)。

前提假設

[编辑]

大多數的t{\displaystyle t} 檢定之統計量具有t=Zs{\displaystyle t={\frac {Z}{s}}}的形式,其中Z{\displaystyle Z}s{\displaystyle s} 是已知資料的函數。Z{\displaystyle Z} 通常被設計成對於對立假說有關的形式,而s{\displaystyle s} 是一個比例母數使t{\displaystyle t} 服從於t{\displaystyle t} 分佈。以單樣本t{\displaystyle t} 檢驗為例,Z=X¯σn{\displaystyle Z={\frac {\bar {X}}{\frac {\sigma }{\sqrt {n}}}}},其中X¯{\displaystyle {\bar {X}}}為樣本平均數,n{\displaystyle n}為樣本數,σ{\displaystyle \sigma }為总体標準差。至於s{\displaystyle s} 在單樣本t{\displaystyle t} 檢驗中為σ^σ{\displaystyle {\frac {\hat {\sigma }}{\sigma }}},其中σ^{\displaystyle {\hat {\sigma }}}為樣本的標準差。在符合零假說的條件下,t{\displaystyle t} 檢定有以下前提:

計算

[编辑]

單樣本t檢驗

[编辑]

檢驗虛無假說為一群來自常態分配獨立樣本xi{\displaystyle x_{i}} 之母體期望值μ{\displaystyle \mu }μ0{\displaystyle \mu _{0}}可利用以下統計量

t=x¯μ0sn{\displaystyle t={\frac {{\overline {x}}-\mu _{0}}{\frac {s}{\sqrt {n}}}}}

其中i=1n{\displaystyle i=1\ldots n}x¯=i=1nxin{\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}}為樣本平均數,s=i=1n(xix¯)2n1{\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}}為樣本標準差n{\displaystyle n}樣本數。該統計量t{\displaystyle t} 在虛無假說:μ=μ0{\displaystyle \mu =\mu _{0}} 為真的條件下服從自由度為n1{\displaystyle n-1}t分佈

配對樣本t檢驗

[编辑]

配對樣本t{\displaystyle t} 檢驗可視為單樣本t{\displaystyle t} 檢驗的擴展,不過檢驗的對象由一群來自常態分配獨立樣本更改為兩配對樣本之觀測值之差。

若兩配對樣本x1i{\displaystyle x_{1i}}x2i{\displaystyle x_{2i}} 之差為di=x1ix2i{\displaystyle d_{i}=x_{1i}-x_{2i}} 獨立且來自常態分配,則di{\displaystyle d_{i}} 之母體期望值μ{\displaystyle \mu } 是否為μ0{\displaystyle \mu _{0}} 可利用以下統計量

t=d¯μ0sd/n{\displaystyle t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}}

其中i=1n{\displaystyle i=1\ldots n}d¯=i=1ndin{\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}}為配對樣本差值之平均數,sd=i=1n(did¯)2n1{\displaystyle s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}}為配對樣本差值之標準差n{\displaystyle n} 為配對樣本數。該統計量t{\displaystyle t} 在虛無假說:μ=μ0{\displaystyle \mu =\mu _{0}} 為真的條件下服從自由度為n1{\displaystyle n-1}t分布

獨立雙樣本t檢驗

[编辑]

同質變異數假設 (Homoscedasticity)、樣本數相等

[编辑]

若兩獨立樣本x1i{\displaystyle x_{1i}}x2i{\displaystyle x_{2i}} 具有相同之樣本數n{\displaystyle n},且來自兩個母體變異數相同(同質變異數假設)的常態分配,則兩母體之期望值差μ1μ2{\displaystyle \mu _{1}-\mu _{2}} 是否為μ0{\displaystyle \mu _{0}} 可利用以下統計量

t=x¯1x¯2μ02sp2n{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {\frac {2s_{p}^{2}}{n}}}}}

其中i=1n{\displaystyle i=1\ldots n}x¯1=(i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n}x¯2=i=1nx2in{\displaystyle {\overline {x}}_{2}={\frac {\sum _{i=1}^{n}x_{2i}}{n}}}為兩樣本各自的平均數,sp2=i=1n(x1ix¯1)2+i=1n(x2ix¯2)22n2{\displaystyle s_{p}^{2}={\frac {\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2}}{2n-2}}}為樣本之共同方差。該統計量t{\displaystyle t} 在虛無假說:μ1μ2=μ0{\displaystyle \mu _{1}-\mu _{2}=\mu _{0}} 為真的條件下服從自由度為2n2{\displaystyle 2n-2}t分佈

同質變異數假設 (Homoscedasticity)、樣本數不相等

[编辑]

若兩獨立樣本x1i{\displaystyle x_{1i}}x2j{\displaystyle x_{2j}} 具有不相同之樣本數n1{\displaystyle n_{1}}n2{\displaystyle n_{2}},且來自兩個母體變異數相同(同質變異數假設)的常態分配,則兩母體之期望值之差μ1μ2{\displaystyle \mu _{1}-\mu _{2}} 是否為μ0{\displaystyle \mu _{0}} 可利用以下統計量

t=x¯1x¯2μ0sp2n1+sp2n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {{\frac {s_{p}^{2}}{n_{1}}}+{\frac {s_{p}^{2}}{n_{2}}}}}}}

其中i=1n1{\displaystyle i=1\ldots n_{1}},其中j=1n2{\displaystyle j=1\ldots n_{2}}x¯1=i=1nx1in{\displaystyle {\overline {x}}_{1}={\frac {\sum _{i=1}^{n}x_{1i}}{n}}}x¯2=i=1nx2in{\displaystyle {\overline {x}}_{2}={\frac {\sum _{i=1}^{n}x_{2i}}{n}}} 為兩樣本各自的平均數,sp2=(i=1n(x1ix¯1)2+j=1n(x2jx¯2)2n1+n22{\displaystyle s_{p}^{2}={\frac {(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2}}{n_{1}+n_{2}-2}}} 為兩樣本共同之方差。該統計量t{\displaystyle t} 在虛無假說:μ1μ2=μ0{\displaystyle \mu _{1}-\mu _{2}=\mu _{0}} 為真的條件下服從自由度為n1+n22{\displaystyle n_{1}+n_{2}-2}t分佈

異質變異數假設 (Heteroscedasticity)

[编辑]

若兩獨立樣本x1i{\displaystyle x_{1i}}x2j{\displaystyle x_{2j}} 具有相同或不相同之樣本數n1{\displaystyle n_{1}}n2{\displaystyle n_{2}},且兩者母體變異數不相等(異質變異數假設)的常態分配,則兩母體之期望值之差μ1μ2{\displaystyle \mu _{1}-\mu _{2}} 是否為μ0{\displaystyle \mu _{0}} 可利用以下統計量

t=x¯1x¯2μ0s12n1+s22n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}}

其中i=1n1{\displaystyle i=1\ldots n_{1}},其中j=1n2{\displaystyle j=1\ldots n_{2}}x¯1=i=1n1x1in1{\displaystyle {\overline {x}}_{1}={\frac {\sum _{i=1}^{n_{1}}x_{1i}}{n_{1}}}}x¯2=j=1n2x2jn{\displaystyle {\overline {x}}_{2}={\frac {\sum _{j=1}^{n_{2}}x_{2j}}{n}}} 為兩樣本各自的平均數,s12=i=1n(x1ix¯1)2n11{\displaystyle s_{1}^{2}={\frac {\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}}{n_{1}-1}}}s22=j=1n(x2jx¯2)2n21{\displaystyle s_{2}^{2}={\frac {\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2}}{n_{2}-1}}} 分別為兩樣本之方差。該統計量t在虛無假說:μ1μ2=μ0{\displaystyle \mu _{1}-\mu _{2}=\mu _{0}} 為真的條件下服從自由度為

df=(s12n1+s22n2)2(s12n1)2n11+(s22n2)2n21{\displaystyle df={\frac {({\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}})^{2}}{{\frac {({\frac {s_{1}^{2}}{n_{1}}})^{2}}{n_{1}-1}}+{\frac {({\frac {s_{2}^{2}}{n_{2}}})^{2}}{n_{2}-1}}}}}

t分布。這種方法又常稱為Welch檢驗。

其它相關檢驗

[编辑]

偏迴歸係數是否為零之檢定

[编辑]
以簡單線性迴歸為例
[编辑]
主条目:線性回歸 § 單變數線性迴歸

模型假設:

yi=α+βxi+εi,{\displaystyle y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},}

其中xi{\displaystyle x_{i}}i=1,,n{\displaystyle i=1,\cdots ,n} 為已知,α{\displaystyle \alpha }β{\displaystyle \beta } 為未知係數,εi{\displaystyle \varepsilon _{i}}殘差獨立且服從期望值0且方差σ2{\displaystyle \sigma ^{2}} 未知的常態分佈,yi{\displaystyle y_{i}}i=1,,n{\displaystyle i=1,\cdots ,n} 為觀測值。我們可以檢驗迴歸係數β{\displaystyle \beta } 是否相等於特定的β0{\displaystyle \beta _{0}},通常使β0=0{\displaystyle \beta _{0}=0} 以檢定xi{\displaystyle x_{i}}yi{\displaystyle y_{i}} 是否存在解釋能力,在此例(簡單線性迴歸模型)即為檢定迴歸式之斜率是否為零。

α^{\displaystyle {\widehat {\alpha }}}β^{\displaystyle {\widehat {\beta }}}最小平方法之估計值,SEα^{\displaystyle SE_{\widehat {\alpha }}}SEβ^{\displaystyle SE_{\widehat {\beta }}}為最小平方法估計值之標準誤差,則

t=β^β0SEβ^Tn2{\displaystyle t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}}

在虛無假說為β=β0{\displaystyle \beta =\beta _{0}} 的情況下服從自由度為n2{\displaystyle n-2}t{\displaystyle t} 分布,此檢定統計量被稱作「t比率 (t-ratio)」,其中

SEβ^=1n2i=1n(yiy^i)2i=1n(xix¯)2{\displaystyle SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}}

由於ε^i=yiy^i=yi(α^+β^xi){\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})}為殘差(即估計誤差),而SSR=i=1nε^i2{\displaystyle {\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}}為殘差之離均平方和,我們可改寫t

t=(β^β0)n2SSRi=1n(xix¯)2{\displaystyle t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {\frac {\text{SSR}}{\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}}}

另请参阅:F检验

電腦軟體

[编辑]

大多數的試算表軟體及統計軟體,諸如QtiPlotOpenOffice.org CalcLibreOffice CalcMicrosoft ExcelSASSPSSStataDAPgretlRPython ([1]页面存档备份,存于互联网档案馆))、PSPPMinitab等,都可以進行t檢驗運算。

编程语言/软件程序函数注释
Microsoft Excel 2010 之前的版本TTEST(array1,array2,tails,type)参见[2]
Microsoft Excel 2010 及更高版本T.TEST(array1,array2,tails,type)参见[3]页面存档备份,存于互联网档案馆
LibreOfficeTTEST(Data1; Data2; Mode; Type)参见[4]页面存档备份,存于互联网档案馆
Google SheetsTTEST(range1, range2, tails, type)参见[5]页面存档备份,存于互联网档案馆
Pythonscipy.stats.ttest_ind(a,b,axis=0,equal_var=True)参见[6]页面存档备份,存于互联网档案馆
Matlabttest(data1, data2)参见[7]页面存档备份,存于互联网档案馆
MathematicaTTest[{data1,data2}]参见[8]页面存档备份,存于互联网档案馆
Rt.test(data1, data2)
SASPROC TTEST参见[9]
JavatTest(sample1, sample2)参见[10]页面存档备份,存于互联网档案馆
JuliaEqualVarianceTTest(sample1, sample2)参见[11]
Statattest data1 == data2See[12]页面存档备份,存于互联网档案馆

參見

[编辑]

參考文獻

[编辑]
  1. ^Richard Mankiewicz,The Story of Mathematics (Princeton University Press), p.158.
  2. ^2.02.1約翰·J·奧康納;埃德蒙·F·羅伯遜,Gosset,MacTutor数学史档案(英语) 
  3. ^Fisher Box, Joan.Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987,2 (1): 45–52.JSTOR 2245613.doi:10.1214/ss/1177013437. 
  4. ^存档副本(PDF). [2013-08-10]. (原始内容(PDF)存档于2017-05-16). 
描述统计学
连续概率
集中趋势
离散程度
分布形态英语Shape of the distribution
离散概率
推論統計學
假說檢定
推論統計學
实验设计
样本量英语Sample size
常规估计
假设检验
生存分析
相關
迴歸分析
相关性
線性回歸
非线性回归
统计图形
其他
检索自“https://zh.wikipedia.org/w/index.php?title=司徒頓t檢定&oldid=89092601
分类:​
隐藏分类:​

[8]ページ先頭

©2009-2025 Movatter.jp