Type 2 error 计算

假設檢定(Hypothesis test)是估計母體參數的統計手法,根據檢定統計量(test statistics)是否落在拒絕區域,來判斷是否拒絕該虛無假設(null hypothesis)。今天要介紹的是假設檢定會犯下的兩種錯誤:型一錯誤(Type I Error)、型二錯誤(Type II Error),並且會輔以實例來示範該如何計算這兩種機率。

為了方便理解,如果檢定統計量不是落在拒絕區域,我會書寫為落在接受區域,這並非正式的名稱,僅僅為了讓讀者易於理解。

型一錯誤(Type I Error)

偶尔能看懂,但是死活记不住,归根结底是没有彻底理解!

Type I and type II errors - wiki

type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding), 

type II error is failing to reject a false null hypothesis (also known as a "false negative" finding). 1-power。

大部分举例都没有讲清楚,必须要结合下面的图才能有直观的理解。

power就是当统计量服从备择假设时,我们得到备择假设的概率。

我们要构建零假设,这就是我们要攻击的目标,我们需要使用我们的数据来拒绝它。

常见的做法是我们需要构建统计量,在H0的假设下,统计量往往有一个分布,当我们计算出统计量处于分布的小概率区域中时,我们就可以说零假设是小概率事件,可以拒绝零假设。

如下图的单侧假设检验,当统计量大于2时,我们就可以拒绝H0,此时我们犯第一类错误地概率就是α,就是零假设是真的,我们却拒绝了它。

当设定了显著性水平后,α就定了,一般为0.05,所以统计量水平也就定了,下图为2. 第二类错误就是,即使没有达到拒绝H0的标准(统计量小于2),但是其实H1是真的,我们却拒绝了它。定义为β。也可以叫做我们接受了错误地H0。

结论:

第一类错误:错误地拒绝了H0

第二类错误:错误地拒绝了H1,换句话说,错误地接受了H0,接受了假的H0,真的很绕口,但是确实一个东西。

与wiki定义完美吻合!!!

Type 2 error 计算

这之后,Sensitivity, Specificity, and ROC Curves就很好理解了。

Type 2 error 计算

此條目可参照英語維基百科相應條目来扩充
若您熟悉来源语言和主题,请协助参考外语维基百科扩充条目。请勿直接提交机械翻译,也不要翻译不可靠、低品质内容。依版权协议,译文需在编辑摘要注明来源,或于讨论页顶部标记{{Translated page}}标签。

型一錯誤型二錯誤(英語:Type I error & Type II error)為统计学中推論統計學統計術語,表示統計學假說檢定中的两种錯誤。

目录

  • 1 定義
    • 1.1 統計背景
    • 1.2 型一錯誤
    • 1.3 型二錯誤
    • 1.4 交叉錯誤率
    • 1.5 偽陽性和偽陰性
  • 2 簡介
  • 3 參考
  • 4 相關條目
  • 5 外部链接

定義[编辑]

統計背景[编辑]

在統計檢驗理論中,統計误差的概念是假說檢定(hypothesis testing)的一個組成部分。 該測試涉及選擇兩個相互競爭的命題,稱為零假設(Null hypothesis),用H0表示,另一種對立假說(Alternative hypothesis),用H1表示。 這在概念上類似於法庭審判中的判決。零假設對應於被告的立場:正如他在被證明有罪之前被假定為無罪一樣,在數據提供反對它的令人信服的證據之前,零假設也被假定為真。 對立假說對應於反對被告的立場。 具體來說,零假設還涉及不存在差異或不存在關聯。 因此,零假設永遠不可能是存在差異或關聯。

如果測試結果與現實相符,則做出了正確的決定。 但是,如果測試結果與實際不符,則發生錯誤。決定錯誤的情況有兩種。 零假設可能為真,而我們拒絕H0。 另一方面,對立假說H1可能為真,而我們不拒絕H0。 兩種錯誤被區分:型一錯誤,與型二錯誤[1]。

型一錯誤[编辑]

型一錯誤是錯誤地拒絕原假設作為檢驗程序的結果。又稱偽陽性(false positive),有時也稱為第一類錯誤。 就法庭示例而言,型一錯誤對應於對無辜被告定罪。

型二錯誤[编辑]

型二錯誤是錯誤地未能拒絕原假設作為測試程序的結果。又稱偽陰性(false negative),也稱為第二類錯誤。 就法庭示例而言,型二錯誤對應於無罪釋放罪犯[2]。

交叉錯誤率[编辑]

交叉錯誤率 (CER) 是型一錯誤和型二錯誤相等的點,代表了衡量生物識別有效性的最佳方法。 具有較低CER值的系統比具有較高CER值的系統提供更高的準確度。

偽陽性和偽陰性[编辑]

主条目:偽陽性和偽陰性

在偽陽性和偽陰性方面,陽性結果對應於拒絕零假设,而陰性結果對應於未能拒絕零假设; “偽”表示得出的結論不正確。 因此,型一錯誤相當於偽陽性,型二錯誤相當於偽陰性。

簡介[编辑]

在假說檢定中,有一種假說稱為“零假设”,記為,假說检验的目的是利用統計的方式,推翻虛無假說的成立,也就是對立假說(Alternative hypothesis,記為)成立。

  • 若零假设事實上成立,但統計檢驗的結果拒絕零假设(接受對立假說),這種錯誤稱為型一錯誤(弃真错误、α錯誤、偽陽性);
  • 若零假设事實上不成立,但統計檢驗的結果不拒絕零假设,這種錯誤稱為型二錯誤(存偽錯誤、β錯誤、偽陰性)。[3]

以利用驗孕棒驗孕為例,此時沒有懷孕為零假设。若用驗孕棒替一位未懷孕者驗孕,結果呈已懷孕,此即型一錯誤。若用驗孕棒替一位已懷孕者驗孕,結果呈未懷孕,此即型二錯誤。

真實情況
(虛無假說)為真 (對立假說)為真
根據研究結果的判斷 拒絕 錯誤判斷
偽陽性型一錯誤
發生機率α(顯著水準)
正確判斷
發生機率1-β(檢定力)
不拒絕 正確判斷
發生機率1-α
錯誤判斷
偽陰性型二錯誤
發生機率β

參考[编辑]

  1. ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
  2. ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
  3. ^ cheng, ayo. 型一錯誤 型二錯誤. myweb.nutn.edu.tw. [2012-02-10]. (原始内容存档于2011-12-16).

相關條目[编辑]

  • 對立假說
  • 信息檢索
  • 零假设
  • ROC曲线
  • 靈敏度和特異度
  • 偽陽性和偽陰性

外部链接[编辑]

  • 直观展示第一型及第二型錯誤的趣图 (页面存档备份,存于互联网档案馆)

统计学

描述统计学

连续概率

集中趋势

平均数(平方 · 算術 · 幾何 · 調和 · 算术-几何 · 几何-调和 · 希羅/平均数不等式) · 中位數 · 眾數

离散程度

全距 · 变异系数 · 百分位數 · 四分位距 · 四分位数 · 標準差 · 方差 · 平均差 · 標準分數 · 切比雪夫不等式 · 基尼系数

分布形态英语Shape of the distribution

中心极限定理 · 矩(偏態 · 峰態)

离散概率

次數英语Count data · 列聯表英语Contingency table

Type 2 error 计算

推論統計學
和假說檢定

推論統計學

置信区间 · 區間估計英语Interval estimation · 显著性差异 · 元分析 · 贝叶斯推断

实验设计

总体 · 抽樣 · 重抽样(刀切法 · 自助法 · 交叉驗證) · 重复英语Replication (statistics) · 阻碍 · 靈敏度和特異度 · 區集英语Blocking (statistics) · 缺失数据

样本量英语Sample size

標準誤 · 零假设 · 备择假设 · 第一类错误与第二类错误 · 统计功效 · 效应值

常规估计

贝叶斯推断 · 區間估計英语Interval estimation · 最大似然估计 · 最小距離估計英语Minimum distance estimation · 矩估计 · 最大间距

假设检验

Z檢驗 · 学生t检验 · F檢定 · 卡方检验 · Wald檢定英语Wald test · 曼-惠特尼檢定英语Mann–Whitney U test · 秩和检验

生存分析

生存函数 · 乘積極限估計量 · 對數秩和檢定 · 失效率 · 危險比例模式

相關及
迴歸分析

相关性

干擾因素 · 皮尔逊積矩相關係數 · 等級相關英语Rank correlation (斯皮尔曼等级相关系数 · 肯德等級相關係數英语Kendall tau rank correlation coefficient) · 自由度 · 误差和残差

線性回歸

線性模型英语Linear model · 一般线性模型 · 廣義線性模型 · 简单线性回归英语Simple linear regression · 普通最小二乘法 · 贝叶斯回归英语Bayesian linear regression · 方差分析 · 协方差分析英语Analysis of covariance

非线性回归

非参数回归模型英语Nonparametric regression · 半参数回归模型英语Semiparametric regression · 邏輯迴歸

统计图形

饼图 · 条形图 · 双标图 · 箱形圖 · 管制圖 · 森林圖英语Forest plot · 直方图 · 分位圖 · 趋势图 · 散点图 · 莖葉圖英语Stem-and-leaf display · 雷达图英语Radar chart · 示意地圖

其他

回應過程效度 · 統計誤用

  • Type 2 error 计算
    分类
  • Type 2 error 计算
    主题
  • Type 2 error 计算
    共享资源
  • Type 2 error 计算
    专题