精选文章 分类--准确率

分类--准确率

作者:dengao9681 时间: 2021-02-07 01:34:14
dengao9681 2021-02-07 01:34:14
【摘要】准确率是一个用于评估分类模型的指标。通俗来说,准确率是指我们的模型预测正确的结果所占的比例。正式点说,准确率的定义如下: 
  
  $$\text{Accuracy} = \frac{\text{Number of correct predictions}}{\text{Total number of predictions}}$$ 
  
  对于二元分类,也可以根据正类别和负类别按如下...

准确率是一个用于评估分类模型的指标。通俗来说,准确率是指我们的模型预测正确的结果所占的比例。正式点说,准确率的定义如下:

$$\text{Accuracy} = \frac{\text{Number of correct predictions}}{\text{Total number of predictions}}$$

对于二元分类,也可以根据正类别和负类别按如下方式计算准确率:

$$\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}$$

其中,TP = 真正例,TN = 真负例,FP = 假正例,FN = 假负例。

让我们来试着计算一下以下模型的准确率,该模型将 100 个肿瘤分为恶性(正类别)或良性(负类别):

真正例 (TP):
  • 真实情况:恶性
  • 机器学习模型预测的结果:恶性
  • TP 结果数:1
假正例 (FP):
  • 真实情况:良性
  • 机器学习模型预测的结果:恶性
  • FP 结果数:1
假负例 (FN):
  • 真实情况:恶性
  • 机器学习模型预测的结果:良性
  • FN 结果数:8
真负例 (TN):
  • 真实情况:良性
  • 机器学习模型预测的结果:良性
  • TN 结果数:90
$$\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN} = \frac{1+90}{1+90+1+8} = 0.91$$

准确率为 0.91,即 91%(总共 100 个样本中有 91 个预测正确)。这表示我们的肿瘤分类器在识别恶性肿瘤方面表现得非常出色,对吧?

实际上,只要我们仔细分析一下正类别和负类别,就可以更好地了解我们模型的效果。

在 100 个肿瘤样本中,91 个为良性(90 个 TN 和 1 个 FP),9 个为恶性(1 个 TP 和 8 个 FN)。

在 91 个良性肿瘤中,该模型将 90 个正确识别为良性。这很好。不过,在 9 个恶性肿瘤中,该模型仅将 1 个正确识别为恶性。这是多么可怕的结果!9 个恶性肿瘤中有 8 个未被诊断出来!

虽然 91% 的准确率可能乍一看还不错,但如果另一个肿瘤分类器模型总是预测良性,那么这个模型使用我们的样本进行预测也会实现相同的准确率(100 个中有 91 个预测正确)。换言之,我们的模型与那些没有预测能力来区分恶性肿瘤和良性肿瘤的模型差不多。

当您使用分类不平衡的数据集(比如正类别标签和负类别标签的数量之间存在明显差异)时,单单准确率一项并不能反映全面情况。

在下一部分中,我们将介绍两个能够更好地评估分类不平衡问题的指标:精确率和召回率。


引用

分类 (Classification):准确率

转载于:https://www.cnblogs.com/taro/p/8643274.html

勿删,copyright占位
您找到想要的结果了吗?
分类--准确率
提交成功!非常感谢您的反馈,我们会继续努力做到更好
分享文章到微博
分享文章到朋友圈

上一篇:分类--真与假以及正类别与负类别

下一篇:leetcode 349. Intersection of Two Arrays

您可能感兴趣

  • 斯坦福计算机视觉课程学习总结 -- 3.线性分类器及损失函数

    课程2和3简介 CS231n 视频课程2和3从图像分类要解决的原始问题及面对的困难为起点,引出第一个也是最直观的最近邻分类器(KNN),讲解KNN模型时,引入了模型的超参(hypeparameter)概念,进一步讨论...

  • PTA 1012 数字分类(20 分)C语言

    PTA 1012 数字分类(20 分)C语言 #include<stdio.h> #include<math.h> int main() { int n; scanf("%d", &n); ...

  • attention+RNN做文本情感分类《Recurrent Attention Network on Memory for Aspect Sentiment Analysis》

    原文链接 本文发表于自然语言处理领域顶级会议 ACL 2017 代码链接 摘要 本文提出了一种基于多重attention的可以捕捉长距离情感特征的框架,该框架对无关信息具有更强的鲁棒性,并且将多重at...

  • PHP实现无限级分类(递归+引用)

    原始数据 数据库 打印到页面 递归 递归的思路就是【找儿子】,也就是循环所有数据,找到每条数据的所有儿子、儿子的儿子、儿子的儿子的儿子…,首先我们知道要找test1的儿子就是找所有pid为1的数据,于是遍历整个...

  • 【基于深度学习的细粒度分类笔记5】22岁复旦学生拿下世界深度学习竞赛冠军:50层ResNet网络

    【导读】 拥有世界上最大的开源车对车(V2V)网络的 Nexar 公布了第二届 Nexar 挑战赛的结果。来自复旦大学的Hengduo Li 拿下冠军。 10月29日,Nexar 公布了第二届 Nexar 挑战赛(使用NEXET 数据库实现户外汽车识别)的获奖名单。Nexar公司成立于2015年,使用智能手机和车辆的摄像头和传感器来创建驾驶感知和A...

  • 无限级分类传值引用

    tree=array();//第一步,将分类ID作为数组密,并创建儿童单元foreach( t r e ...

  • java锁的分类

    在读很多并发文章中,会提及各种各样锁如公平锁,乐观锁等等,这篇文章介绍各种锁的分类。我介绍的内容如下: 公平锁/非公平锁 可重入锁 独享锁/共享锁 互斥锁/读写锁 乐观锁/悲观锁 分段锁 偏向锁/轻量级锁/重量级锁 自旋锁 上面是很多锁的名词,这些分类并不是全是指锁的状态,有的指锁的特性,有的指锁的设计,下面总结的内容是对每个锁的名词进行一定的解释...

  • letcode 颜色分类

    题目描述: 给定一个包含红色、白色和蓝色,一共 n 个元素的数组,原地对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序排列。 此题中,我们使用整数 0、 1 和 2 分别表示红色、白色和蓝色。 ...

CSDN

CSDN

中国开发者社区CSDN (Chinese Software Developer Network) 创立于1999年,致力为中国开发者提供知识传播、在线学习、职业发展等全生命周期服务。
分类--准确率介绍:华为云为您免费提供分类--准确率在博客、论坛、帮助中心等栏目的相关文章,同时还可以通过 站内搜索 查询更多分类--准确率的相关内容。| 移动地址: 分类--准确率 | 写博客