Type 2 error 计算

假設檢定(Hypothesis test)是估計母體參數的統計手法，根據檢定統計量(test statistics)是否落在拒絕區域，來判斷是否拒絕該虛無假設(null hypothesis)。今天要介紹的是假設檢定會犯下的兩種錯誤：型一錯誤(Type I Error)、型二錯誤(Type II Error)，並且會輔以實例來示範該如何計算這兩種機率。

目錄 Show

型一錯誤(Type I Error)
定義[编辑]
統計背景[编辑]
型一錯誤[编辑]
型二錯誤[编辑]
交叉錯誤率[编辑]
偽陽性和偽陰性[编辑]
簡介[编辑]
參考[编辑]
相關條目[编辑]
外部链接[编辑]

為了方便理解，如果檢定統計量不是落在拒絕區域，我會書寫為落在接受區域，這並非正式的名稱，僅僅為了讓讀者易於理解。

型一錯誤(Type I Error)

偶尔能看懂，但是死活记不住，归根结底是没有彻底理解！

Type I and type II errors - wiki

type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding),

type II error is failing to reject a false null hypothesis (also known as a "false negative" finding). 1-power。

大部分举例都没有讲清楚，必须要结合下面的图才能有直观的理解。

power就是当统计量服从备择假设时，我们得到备择假设的概率。

我们要构建零假设，这就是我们要攻击的目标，我们需要使用我们的数据来拒绝它。

常见的做法是我们需要构建统计量，在H0的假设下，统计量往往有一个分布，当我们计算出统计量处于分布的小概率区域中时，我们就可以说零假设是小概率事件，可以拒绝零假设。

如下图的单侧假设检验，当统计量大于2时，我们就可以拒绝H0，此时我们犯第一类错误地概率就是α，就是零假设是真的，我们却拒绝了它。

当设定了显著性水平后，α就定了，一般为0.05，所以统计量水平也就定了，下图为2. 第二类错误就是，即使没有达到拒绝H0的标准（统计量小于2），但是其实H1是真的，我们却拒绝了它。定义为β。也可以叫做我们接受了错误地H0。

结论：

第一类错误：错误地拒绝了H0

第二类错误：错误地拒绝了H1，换句话说，错误地接受了H0，接受了假的H0，真的很绕口，但是确实一个东西。

与wiki定义完美吻合！！！

这之后，Sensitivity, Specificity, and ROC Curves就很好理解了。

此條目可参照英語維基百科相應條目来扩充。
若您熟悉来源语言和主题，请协助参考外语维基百科扩充条目。请勿直接提交机械翻译，也不要翻译不可靠、低品质内容。依版权协议，译文需在编辑摘要注明来源，或于讨论页顶部标记{{Translated page}}标签。

型一錯誤與型二錯誤（英語：Type I error & Type II error）為统计学中推論統計學統計術語，表示統計學假說檢定中的两种錯誤。

定義[编辑]

統計背景[编辑]

在統計檢驗理論中，統計误差的概念是假說檢定(hypothesis testing)的一個組成部分。該測試涉及選擇兩個相互競爭的命題，稱為零假設(Null hypothesis)，用H0表示，另一種對立假說(Alternative hypothesis)，用H1表示。這在概念上類似於法庭審判中的判決。零假設對應於被告的立場：正如他在被證明有罪之前被假定為無罪一樣，在數據提供反對它的令人信服的證據之前，零假設也被假定為真。對立假說對應於反對被告的立場。具體來說，零假設還涉及不存在差異或不存在關聯。因此，零假設永遠不可能是存在差異或關聯。

如果測試結果與現實相符，則做出了正確的決定。但是，如果測試結果與實際不符，則發生錯誤。決定錯誤的情況有兩種。零假設可能為真，而我們拒絕H0。另一方面，對立假說H1可能為真，而我們不拒絕H0。兩種錯誤被區分：型一錯誤，與型二錯誤[1]。

型一錯誤[编辑]

型一錯誤是錯誤地拒絕原假設作為檢驗程序的結果。又稱偽陽性（false positive），有時也稱為第一類錯誤。就法庭示例而言，型一錯誤對應於對無辜被告定罪。

型二錯誤[编辑]

型二錯誤是錯誤地未能拒絕原假設作為測試程序的結果。又稱偽陰性（false negative），也稱為第二類錯誤。就法庭示例而言，型二錯誤對應於無罪釋放罪犯[2]。

交叉錯誤率[编辑]

交叉錯誤率 (CER) 是型一錯誤和型二錯誤相等的點，代表了衡量生物識別有效性的最佳方法。具有較低CER值的系統比具有較高CER值的系統提供更高的準確度。

偽陽性和偽陰性[编辑]

主条目：偽陽性和偽陰性

在偽陽性和偽陰性方面，陽性結果對應於拒絕零假设，而陰性結果對應於未能拒絕零假设； “偽”表示得出的結論不正確。因此，型一錯誤相當於偽陽性，型二錯誤相當於偽陰性。

簡介[编辑]

在假說檢定中，有一種假說稱為“零假设”，記為，假說检验的目的是利用統計的方式，推翻虛無假說的成立，也就是對立假說（Alternative hypothesis，記為或）成立。

若零假设事實上成立，但統計檢驗的結果拒絕零假设（接受對立假說），這種錯誤稱為型一錯誤（弃真错误、α錯誤、偽陽性）；
若零假设事實上不成立，但統計檢驗的結果不拒絕零假设，這種錯誤稱為型二錯誤（存偽錯誤、β錯誤、偽陰性）。[3]

以利用驗孕棒驗孕為例，此時沒有懷孕為零假设。若用驗孕棒替一位未懷孕者驗孕，結果呈已懷孕，此即型一錯誤。若用驗孕棒替一位已懷孕者驗孕，結果呈未懷孕，此即型二錯誤。

	真實情況
（虛無假說）為真	（對立假說）為真
根據研究結果的判斷	拒絕	錯誤判斷（偽陽性、型一錯誤）發生機率α（顯著水準）	正確判斷發生機率1-β（檢定力）
不拒絕	正確判斷發生機率1-α	錯誤判斷（偽陰性、型二錯誤）發生機率β

參考[编辑]

^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
^ cheng, ayo. 型一錯誤型二錯誤. myweb.nutn.edu.tw. [2012-02-10]. （原始内容存档于2011-12-16）.

外部链接[编辑]

直观展示第一型及第二型錯誤的趣图（页面存档备份，存于互联网档案馆）

统计学

描述统计学

连续概率

集中趋势

平均数（平方 · 算術 · 幾何 · 調和 · 算术-几何 · 几何-调和 · 希羅／平均数不等式） · 中位數 · 眾數

离散程度

全距 · 变异系数 · 百分位數 · 四分位距 · 四分位数 · 標準差 · 方差 · 平均差 · 標準分數 · 切比雪夫不等式 · 基尼系数

分布形态（英语：Shape of the distribution）

中心极限定理 · 矩（偏態 · 峰態）

离散概率

次數（英语：Count data） · 列聯表（英语：Contingency table）

推論統計學
和假說檢定

推論統計學

置信区间 · 區間估計（英语：Interval estimation） · 显著性差异 · 元分析 · 贝叶斯推断

实验设计

总体 · 抽樣 · 重抽样（刀切法 · 自助法 · 交叉驗證） · 重复（英语：Replication (statistics)） · 阻碍 · 靈敏度和特異度 · 區集（英语：Blocking (statistics)） · 缺失数据

样本量（英语：Sample size）

標準誤 · 零假设 · 备择假设 · 第一类错误与第二类错误 · 统计功效 · 效应值

常规估计

贝叶斯推断 · 區間估計（英语：Interval estimation） · 最大似然估计 · 最小距離估計（英语：Minimum distance estimation） · 矩估计 · 最大间距

假设检验

Z檢驗 · 学生t检验 · F檢定 · 卡方检验 · Wald檢定（英语：Wald test） · 曼-惠特尼檢定（英语：Mann–Whitney U test） · 秩和检验

生存分析

生存函数 · 乘積極限估計量 · 對數秩和檢定 · 失效率 · 危險比例模式

相關及
迴歸分析