精选文章 深入理解卷积神经网络工作原理

深入理解卷积神经网络工作原理

作者:追逐AI的蜗牛 时间: 2020-08-05 03:42:31
追逐AI的蜗牛 2020-08-05 03:42:31

       卷积神经网络的核心思想就是设计多个卷积层,卷积层里设计一系列卷积核,输入数据经过卷积层中的卷积核处理,一层层向前推进得到最终的输出数据,这个过程我们称为数据的特征提取。

卷积核

       从上面的概述知道,卷积核是卷积神经网络的核心,这也是它为什么叫卷积神经网络的原因。那么要理解卷积神经网络的原理,就必须理解卷积核,而要理解卷积核,要从图像处理开始理解。

                                                          深入理解卷积神经网络工作原理1

       上图可以大致表示图像处理的原理:利用一定大小的矩阵在图像上滑动矩阵,与矩阵所覆盖区域(邻域)像素进行加、乘运算,一个特定的矩阵可以实现某种特定的图像处理的功能,设计不同的矩阵(设计矩阵中不同的参数),可以实现不同的功能。           为了方便理解,我举例说明,Sobel算子用于提取图像中的边缘信息,下图中左边用于提取水平方向边缘,右边用于提取垂直方向的边缘,他们都是通过设计一个特定的矩阵在图像上滑动遍历图像信息,从而提取到图像中的边缘信息

                                                        深入理解卷积神经网络工作原理2

       前面提到的矩阵在图像处理中称为核,图像滤波、图像增强、边缘检测等算法都是设计特定核来实现特定的功能,在卷积神经网络中称为卷积核,他们的本质是一样的(即数学计算原理一致),作用也是一样的(学习/提取特征),区别在于图像处理中核的参数有人为设计,参数设计不同可以实现不同的功能,而卷积核的参数是自主学习得到

工作原理

       卷积神经网络特征学习可以分为三步:自主特征学习、多特征学习、复杂特征学习,下面从这三部分进行详细说明

  • 自主特征学习       

       我们发现,通过设计不同的参数可以学习到图像中的不同特征,那么有没有什么办法可以自动设计核的参数,让其实现特定特征的学习呢?卷积神经网络通过设计损失函数,通过反复迭代来最小化预测结果和实际结果的误差来驱动卷积核中的参数调整,从而达到自主学习的目的。

  • 多特征学习

       单一的特征往往是不够的,所以卷积层中一般设计多个卷积核,每个卷积核可以独立的学习某个特征,这样就丰富了特征类型,有利于最终的决策,这就相当于你对某件时间做决定,只有信息量越多(特征多)最终做的决定才可能约正确。

  • 复杂特征学习

       即使学习的特征类型很多,如果学习的特征比较简单,面对复杂的问题可能还是无法做出较好的决策。卷积神经网络将该层学习到的特征送到下一层,在已学习到的特征基础上进一步学习更加复杂的特征,由此一层层推进,最终学习到足够复杂的特征。

总结

        通过上面的说明我们可以发现,卷积神经网络可以自主的调整卷积核的参数从而自主学习特征,并通过设计多个卷积核实现多特征学习,多层连续学习复杂特征。这些特点保证了卷积神经网络具有很强的学习能力和自适应能力,所以会比传统的人工设计特征的方式有更好的表现

 

勿删,copyright占位
分享文章到微博
分享文章到朋友圈

上一篇:Web端即时通讯实践干货:如何让WebSocket断网重连更快速?

下一篇:BiTraP:Bi-directional Pedestrian Trajectory Prediction with Multi-modal Goal Estimation

您可能感兴趣

  • 美团数据库运维自动化系统构建之路

    本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和厦门等地举行,要参加下一次最新沙龙活动?赶快关注微信公众号“美团点评技术团队”。 本次沙龙主要围绕数据库相关的主题,内容包括美团数据库自动化运维系统构建、点评侧My...

  • 论文|从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考...

    点击标题下「搜索与推荐Wiki」可快速关注 ▼ 相关推荐 ▼ 1、基于DNN的推荐算法介绍 2、传统机器学习和前沿深度学习推荐模型演化关系 3、论文|AGREE-基于注意力机制的群组推荐(附代码) 4、论文|被“玩烂”了的协同过滤加上神经网络怎么搞? 本文包含(文章较长,建议先收藏再阅读,点击文末的阅读原文,查看更多推荐相关文章): DSSM DSSM的变种 MV-DNN Google Tw...

  • 传统推荐模型的特点总结

    模型名称 基本原理 特点 局限性 协同过滤 根据用户的行为历史生成用户-物品共现矩阵,利用用户相似性和物品相似性进行推荐 原理简单、直接,应用广泛 泛化能力差,处理稀疏矩阵的能力差,推荐结果的头部效应明显 矩阵分解 将协同过滤算法中的共现矩阵分解为用户矩阵和物品矩阵,利用用户隐向量和物品隐向量的内积进行排序并推荐 相较协同过滤,泛化能力有所增强,对稀疏矩阵的处理能力有所增强 除了用户历史行为...

  • 如何避免被以太坊天价 gas 费 PUA?

    近日,随着 ETH 价格突破年内新高一度甚至超过 400 美元(截稿日前价格),ETH2.0 多客户端测试网 Medalla 即将启动,Yield Farming 热潮持续火爆等多重利好,让很多重仓 ETH 的朋友喜笑颜开的同时,涨势更加“喜人”的 gas 费也让一众 DeFi 用户叫苦不迭。 某资深用户“吐槽”道,“为了把我的 15 美元抵押进 Curve,我已经花了 14 美元的 gas...

  • WKA去中心化交易,重构区块链价值网络

    随着互联网技术的不断成熟与发展,越来越多的人选择线上交易。通证化是公司体制的变革,是未来各类机构的重要组织形态和机会,是可以将公司用户与公司权益的分配主体真正统一起来的经济模式。于是,数字资产安全与快捷的优势则日益凸显。 正如区块链的本质是“去中心化”。随着区块链技术的发展和场景应用的日益普及,未来区块链将会颠覆整个社会的运作模式、生产模式甚至公司治理模式。于是WKA去中心化交易所应运而生,...

  • 【字符检测DBNet】《Real-time scene Text Detection with Differentiable Binarization》

    论文团队:华中科技大学(白翔) 论文链接:https://arxiv.org/pdf/1911.08947.pdf 工程链接:https://github.com/MhLiao/DB 该算法的特点就是:后处理速度快,与PANNet相比,可以节省差不多一半的时间(在本人台式机cpu运行); 目录 1.算法的整体框架 2.可微二值(differentiable binarization) 3.自...

  • 华为、苹果、三星的手机终结之战

    过去10年中,智能手机的快速普及,改变了全世界大多数人的生活和工作方式,而在这场变革背后,苹果、三星、华为这些科技巨头的积极推动作用不容忽视。 其中三星起到的作用尤其不容小觑,2011年之后,全球智能手机市场中三星份额整体超过苹果,以每年2、3亿部出货量,在全球数十亿用户群体中不断扩散影响力。单从智能手机出货量这个方面考虑,过去9年,三星是全球市场中无可争议的霸主。 数据来自IDC 自201...

  • 对云桌面、桌面云、私有云的一些看法

    最近整理了一下自2017年以来自己对私有云服务平台构建的一些认识,并以刚刚为某后勤保障部队单位提供的小规模私有云服务平台为例阐述。 私有云平台、云计算服务与虚拟化: 我个人认为这三个名称分别指涉了三个不同的事物: 私有云平台:在实践中,私有云平台时包含了服务端软硬件集成和客户端软硬件集成的一整套特定业务需求场景的、已经处于落地实施阶段的解决方案项目。 比如某后勤保障部队为简化征兵流程、节省相...

华为云40多款云服务产品0元试用活动

免费套餐,马上领取!
CSDN

CSDN

中国开发者社区CSDN (Chinese Software Developer Network) 创立于1999年,致力为中国开发者提供知识传播、在线学习、职业发展等全生命周期服务。