混淆矩阵——灵敏性和特异性理解
定义
灵 敏 度 S e n s i t i v i t y = T P T P + F N 灵敏度Sensitivity=\frac{TP}{TP+FN}灵敏度Sensitivity=TP+FNTP
特 异 性 S p e c i f i c i t y = T N T N + F P 特异性Specificity=\frac{TN}{TN+FP}特异性Specificity=TN+FPTN
案例
假设一共有100,000名患者,其中患有恶性肿瘤的人数为200人,即患病率为0.2%,实际检测结果如下表:
测试阳性 | 测试阴性 | 总计 | |
---|---|---|---|
实际阳性 | 160 | 40 | 200 |
实际阴性 | 29940 | 69860 | 99800 |
总计 | 30100 | 69900 | 1000000 |
根据以上数据:
灵 敏 度 S e n s i t i v i t y = T P T P + F N = 160 160 + 400 = 80.0 % 灵敏度Sensitivity=\frac{TP}{TP+FN}=\frac{160}{160+400}=80.0\%灵敏度Sensitivity=TP+FNTP=160+400160=80.0%
特 异 性 S p e c i f i c i t y = T N T N + F P = 69860 69860 + 29940 = 70.0 % 特异性Specificity=\frac{TN}{TN+FP}=\frac{69860}{69860+29940}=70.0\%特异性Specificity=TN+FPTN=69860+2994069860=70.0%
即:
灵敏度(又称召回率)表示实际检测出的患病人数占总患病人数的比例达到80%,即能检测出来的真实患者比例
特异性表示测试在不患病人群中,确定排除不患病的概率达到70%,将有30%的可能性会被测试为阳性,而实际上并不患病。即能检测出来真实不患病的比例。
更优的模型,可以使全体样本在四个象限内的分布比例更加优化,提升灵敏度和特异性,增加了正对角线上样本的占比,也就是改进了检测效果。