计算机视觉工程师在面试过程中主要考察三个内容:图像处理、机器学习、深度学习。然而,各类资料纷繁复杂,或是简单的知识点罗列,或是有着详细数学推导令人望而生畏的大部头。为了督促自己学习,也为了方便后人,决心将常考必会的知识点以通俗易懂的方式设立专栏进行讲解,努力做到长期更新。此专栏不求甚解,只追求应付一般面试。希望该专栏羽翼渐丰之日,可以为大家免去寻找资料的劳累。每篇介绍一个知识点,没有先后顺序。想了解什么知识点可以私信或者评论,如果重要而且恰巧我也能学会,会尽快更新。最后,每一个知识点我会参考很多资料。考虑到简洁性,就不引用了。如有冒犯之处,联系我进行删除或者补加引用。在此先提前致歉了!
如题,这些东西大多数人都会
但是,记忆内容较多
面试一紧张。。。
主要目的是帮助大家记忆
会分享一些个人的记忆技巧
基本概念
P | Positive | 阳性 | 正样本 |
---|---|---|---|
N | Negative | 阴性 | 负样本 |
T | True | 真 |
---|---|---|
TP | True Positive | 真阳性 |
TN | True Negative | 真阴性 |
F | False | 假 |
---|---|---|
FP | False Positive | 假阳性 |
FN | False Negative | 假阴性 |
P = TP + FN
N = TN + FP
举个例子
正样本(阳性)被错误判定为负样本(阴性)
对应上述的FN
五个率
准确率(Accuracy)
反应对整体样本的分类
有多少样本预测正确
精确率(Precision)
预测的正样本中对了多少
精确率以P开头,所以公式里全是P
召回率(Recall)
正样本预测对了多少
召回率和精确率组队记忆,因为精确率都是P
所以召回率里有N
漏警率(Missing Alarm)
正样本预测错了多少
与召回率组队记忆,召回和漏警是反义词
所以分子取反,T变F,P变N
虚警率(False Alarm)
预测的正样本中错了多少
F1 Score
上述指标都存在片面性
计算精确率和召回率的调和平均数
得到一个相对全面的指标
记忆关键点:调和平均数、PR
因为后面还有P-R曲线,所以PR是关键词,应该不难记
P-R曲线
F1 Score还不过瘾
使用曲线来更加全面衡量
P是Precision,是纵轴
R是Recall,是横轴
一个增加,另一个减小,反比例
R的下面像不像两条腿?
有两条腿才能更接地气,与大地贴合
所以R是水平的横轴
ROC曲线
受试者工作特性(Receiver Operating Characteristic)
另一种评价曲线
表格中的R代表Rate
一个增加,另一个增加,正比例
横轴 | 假阳性率 | FPR | FP/N |
---|---|---|---|
纵轴 | 真阳性率 | TPR | TP/P |
阳性都是P,真的是T,假的是F
假的对应假的 分母是N
真的对应真的 分母是P
假的人被打倒,趴在了地上,所以是横轴
AUC(Area Under Curve)
对应上述两种曲线(一般对应ROC)
曲线和横轴围成的面积
或者说曲线的积分
以上两个曲线横轴和纵轴的最大值都是1
所以AUC<=1
AUC越大,模型越好
这两个曲线怎么画?
改变分类的阈值(分类的标准)
横轴和纵轴的值会随之变化
阈值取的越多
点越多
就画出来曲线了
两个曲线的使用范围?
根据计算公式
P-R主要关注正样本
ROC关注整体
基于此
样本比例变化大的时候
P-R变化很大
ROC变化较小
所以
如果比较在意样本比例变化的影响,用P-R
反之,用ROC
完
欢迎讨论 欢迎吐槽
转载:https://blog.csdn.net/weixin_39417323/article/details/105712341