假設檢定(Hypothesis test)是估計母體參數的統計手法,根據檢定統計量(test statistics)是否落在拒絕區域,來判斷是否拒絕該虛無假設(null hypothesis)。今天要介紹的是假設檢定會犯下的兩種錯誤:型一錯誤(Type I Error)、型二錯誤(Type II Error),並且會輔以實例來示範該如何計算這兩種機率。 為了方便理解,如果檢定統計量不是落在拒絕區域,我會書寫為落在接受區域,這並非正式的名稱,僅僅為了讓讀者易於理解。型一錯誤(Type I Error)
偶尔能看懂,但是死活记不住,归根结底是没有彻底理解!
Type I and type II errors - wiki
type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding),
type II error is failing to reject a false null hypothesis (also known as a "false negative" finding). 1-power。
大部分举例都没有讲清楚,必须要结合下面的图才能有直观的理解。
power就是当统计量服从备择假设时,我们得到备择假设的概率。
我们要构建零假设,这就是我们要攻击的目标,我们需要使用我们的数据来拒绝它。
常见的做法是我们需要构建统计量,在H0的假设下,统计量往往有一个分布,当我们计算出统计量处于分布的小概率区域中时,我们就可以说零假设是小概率事件,可以拒绝零假设。
如下图的单侧假设检验,当统计量大于2时,我们就可以拒绝H0,此时我们犯第一类错误地概率就是α,就是零假设是真的,我们却拒绝了它。
当设定了显著性水平后,α就定了,一般为0.05,所以统计量水平也就定了,下图为2. 第二类错误就是,即使没有达到拒绝H0的标准(统计量小于2),但是其实H1是真的,我们却拒绝了它。定义为β。也可以叫做我们接受了错误地H0。
结论:
第一类错误:错误地拒绝了H0
第二类错误:错误地拒绝了H1,换句话说,错误地接受了H0,接受了假的H0,真的很绕口,但是确实一个东西。
与wiki定义完美吻合!!!
这之后,Sensitivity, Specificity, and ROC Curves就很好理解了。
此條目可参照英語維基百科相應條目来扩充。 若您熟悉来源语言和主题,请协助参考外语维基百科扩充条目。请勿直接提交机械翻译,也不要翻译不可靠、低品质内容。依版权协议,译文需在编辑摘要注明来源,或于讨论页顶部标记{{Translated page}}标签。 |
型一錯誤與型二錯誤(英語:Type I error & Type II error)為统计学中推論統計學統計術語,表示統計學假說檢定中的两种錯誤。
目录
- 1 定義
- 1.1 統計背景
- 1.2 型一錯誤
- 1.3 型二錯誤
- 1.4 交叉錯誤率
- 1.5 偽陽性和偽陰性
- 2 簡介
- 3 參考
- 4 相關條目
- 5 外部链接
定義[编辑]
統計背景[编辑]
在統計檢驗理論中,統計误差的概念是假說檢定(hypothesis testing)的一個組成部分。 該測試涉及選擇兩個相互競爭的命題,稱為零假設(Null hypothesis),用H0表示,另一種對立假說(Alternative hypothesis),用H1表示。 這在概念上類似於法庭審判中的判決。零假設對應於被告的立場:正如他在被證明有罪之前被假定為無罪一樣,在數據提供反對它的令人信服的證據之前,零假設也被假定為真。 對立假說對應於反對被告的立場。 具體來說,零假設還涉及不存在差異或不存在關聯。 因此,零假設永遠不可能是存在差異或關聯。
如果測試結果與現實相符,則做出了正確的決定。 但是,如果測試結果與實際不符,則發生錯誤。決定錯誤的情況有兩種。 零假設可能為真,而我們拒絕H0。 另一方面,對立假說H1可能為真,而我們不拒絕H0。 兩種錯誤被區分:型一錯誤,與型二錯誤[1]。
型一錯誤[编辑]
型一錯誤是錯誤地拒絕原假設作為檢驗程序的結果。又稱偽陽性(false positive),有時也稱為第一類錯誤。 就法庭示例而言,型一錯誤對應於對無辜被告定罪。
型二錯誤[编辑]
型二錯誤是錯誤地未能拒絕原假設作為測試程序的結果。又稱偽陰性(false negative),也稱為第二類錯誤。 就法庭示例而言,型二錯誤對應於無罪釋放罪犯[2]。
交叉錯誤率[编辑]
交叉錯誤率 (CER) 是型一錯誤和型二錯誤相等的點,代表了衡量生物識別有效性的最佳方法。 具有較低CER值的系統比具有較高CER值的系統提供更高的準確度。
偽陽性和偽陰性[编辑]
主条目:偽陽性和偽陰性
在偽陽性和偽陰性方面,陽性結果對應於拒絕零假设,而陰性結果對應於未能拒絕零假设; “偽”表示得出的結論不正確。 因此,型一錯誤相當於偽陽性,型二錯誤相當於偽陰性。
簡介[编辑]
在假說檢定中,有一種假說稱為“零假设”,記為,假說检验的目的是利用統計的方式,推翻虛無假說的成立,也就是對立假說(Alternative hypothesis,記為或)成立。
- 若零假设事實上成立,但統計檢驗的結果拒絕零假设(接受對立假說),這種錯誤稱為型一錯誤(弃真错误、α錯誤、偽陽性);
- 若零假设事實上不成立,但統計檢驗的結果不拒絕零假设,這種錯誤稱為型二錯誤(存偽錯誤、β錯誤、偽陰性)。[3]
以利用驗孕棒驗孕為例,此時沒有懷孕為零假设。若用驗孕棒替一位未懷孕者驗孕,結果呈已懷孕,此即型一錯誤。若用驗孕棒替一位已懷孕者驗孕,結果呈未懷孕,此即型二錯誤。
(虛無假說)為真 | (對立假說)為真 | |
拒絕 | 錯誤判斷 (偽陽性、型一錯誤) 發生機率α(顯著水準) | 正確判斷 發生機率1-β(檢定力) |
不拒絕 | 正確判斷 發生機率1-α | 錯誤判斷 (偽陰性、型二錯誤) 發生機率β |
參考[编辑]
- ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
- ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
- ^ cheng, ayo. 型一錯誤 型二錯誤. myweb.nutn.edu.tw. [2012-02-10]. (原始内容存档于2011-12-16).
相關條目[编辑]
- 對立假說
- 信息檢索
- 零假设
- ROC曲线
- 靈敏度和特異度
- 偽陽性和偽陰性
外部链接[编辑]
- 直观展示第一型及第二型錯誤的趣图 (页面存档备份,存于互联网档案馆)
| |||||||||||
| |||||||||||
| |||||||||||
饼图 · 条形图 · 双标图 · 箱形圖 · 管制圖 · 森林圖(英语:Forest plot) · 直方图 · 分位圖 · 趋势图 · 散点图 · 莖葉圖(英语:Stem-and-leaf display) · 雷达图(英语:Radar chart) · 示意地圖 | |||||||||||
回應過程效度 · 統計誤用 | |||||||||||
|