卷积神经网络简介:什么是机器学习?——第一部分
摘要
随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本系列文章基于此解释了卷积神经网络(CNN)及其对人工智能和机器学习的意义。CNN是一种能够从复杂数据中提取特征的强大工具,例如识别音频信号或图像信号中的复杂模式就是其应用之一。本文讨论了CNN相对于经典线性规划的优势,后续文章《训练卷积神经网络:什么是机器学习?——第二部分》将讨论如何训练CNN模型,系列文章的第三部分将讨论一个特定用例,并使用专门的AI微控制器对模型进行测试。
什么是卷积神经网络?
(资料图)
神经网络是一种由神经元组成的系统或结构,它使AI能够更好地理解数据,进而解决复杂问题。虽然神经网络有许多种类型,但本系列文章将只关注卷积神经网络(CNN),其主要应用领域是对输入数据的模式识别和对象分类。CNN是一种用于深度学习的人工神经网络。这种网络由输入层、若干卷积层和输出层组成。卷积层是最重要的部分,它们使用一组独特的权重和滤波器,使得网络可以从输入数据中提取特征。数据可以是许多不同的形式,如图像、音频和文本。这种提取特征的过程使CNN能够识别数据中的模式从而让工程师能够创建更有效和高效的应用。为了更好地理解CNN,我们首先将讨论经典的线性规划。
经典控制技术中的线性规划
控制技术的任务是借助传感器读取数据并进行处理,然后根据规则做出响应,最后显示或发送结果。例如,温度调节器每秒钟测量一次温度,通过微控制器单元(MCU)读取温度传感器的数据。该数值用于闭环控制系统的输入,并与设定的温度进行比较。这就是一个借助MCU执行线性规划的例子,这种技术通过比较预编程值和实际值来给出明确的结论。相比之下, AI系统通常依据概率论来发挥作用。
复杂模式和信号处理
许多应用所使用的输入数据必须首先由模式识别系统加以判别。模式识别可以应用于不同的数据结构。本文讨论的例子限定为一维或二维的数据结构,比如音频信号、心电图(ECG)、光电容积脉搏波(PPG)、一维的振动数据或波形、热图像、二维的瀑布图数据。
在上述模式识别中,将应用通过MCU的代码来实现是极其困难的。一个例子是识别图像中的具体对象(例如猫):这种情况下无法区分要分析的图像是很早摄录的,还是刚刚由从相机读取的。分析软件基于一些特定的规则来判断图片中是否有猫:比如说猫必须有典型的尖耳朵、三角形的鼻子和胡须。如果可以在图像中识别出这些特征,软件便可以报告在图像中发现了猫。但是这存在一些问题:如果图像只显示了猫的背面,模式识别系统会怎么办?如果猫没有胡须或者在事故中失去了腿,会发生什么?尽管这些异常情况不太可能出现,但模式识别的代码将不得不考虑所有可能的异常情况,从而增加大量额外的规则。即使在这个简单的例子中,软件设置的规则也会变得非常复杂。
机器学习如何取代经典规则
AI背后的核心思想是在小范围内模仿人类进行学习。它不依赖于制定大量的if-then规则,而是建立一个通用的模式识别的机器模型。这两种方法的关键区别在于,与一套复杂的规则相比,AI不会提供明确的结果。AI不会明确报告“我在图像中识别出了一只猫”,而是提供类似这样的结论:“图像中有一只猫的概率为97.5%,它也可能是豹子(2.1%)或老虎(0.4%)。”这意味着在模式识别的过程结束时,应用的开发人员必须通过决策阈值做出决定。
另一个区别是AI并不依赖固定的规则,而是要经过训练。训练过程需要将大量猫的图像展示给神经网络以供其学习。最终,神经网络将能够独立识别图像中是否有猫。关键的一点是,未来AI可以不局限于已知的训练图像开展识别。该神经网络需要映射到MCU中。
AI的模式识别内部到底是什么?
AI的神经元网络类似于人脑的生物神经元网络。一个神经元有多个输入,但只有一个输出。基本上,这些神经元都是输入的线性变换——将输入乘以数字(权重w)并加上一个常数(偏置b),然后通过一个固定的非线性函数产生输出,该函数也被称为激活函数 。作为网络中唯一的非线性部分,激活函数用于定义人工神经元值的激活范围。神经元的功能在数学上可以描述为
其中,f 为激活函数,w为权重,x为输入数据,b为偏置。数据可以是单独的标量、向量或矩阵。图1显示了一个神经元,它拥有三个输入和一个激活函数ReLU 。网络中的神经元总是分层排列的。
图1.拥有三个输入和一个输出的神经元
如上所述,CNN用于输入数据的模式识别和对象分类。CNN分为不同的部分:一个输入层、若干隐藏层和一个输出层。图2显示了一个小型网络,它包含一个具有三个输入的输入层、一个具有五个神经元的隐藏层和一个具有四个输出的输出层。所有神经元的输出都连接到下一层的所有输入。图2所示的网络不具有现实意义,这里仅用于演示说明。即使对于这个小型网络,用于描述网络的方程中也具有32个偏置和32个权重。
CIFAR神经网络是一种广泛用于图像识别的CNN。它主要由两种类型的层组成:卷积层和池化层,这两种层分别使用卷积和池化两种方法,在神经网络的训练中非常有效。卷积层使用一种被称为卷积的数学运算来识别像素值数组的模式。卷积发生在隐藏层中,如图3所示。卷积会重复多次直至达到所需的精度水平。如果要比较的两个输入值(本例是输入图像和滤波器)相似,那么卷积运算的输出值总会特别高。滤波器有时也被称为卷积核。然后,结果被传递到池化层提取特征生成一个特征图,表征输入数据的重要特征,称为池化。池化层的运行需要依赖另一个滤波器,称为池化滤波器。训练后,在网络运行的状态下,特征图与输入数据进行比较。由于特征图保留了特定的特征,所以只有当内容相似时,神经元的输出才会被触发。通过组合使用卷积和池化,CIFAR网络可用于高精度地识别和分类图像中的各种对象。
图2.一个小型神经网络
CIFAR-10是一个特定数据集,通常用于训练CIFAR神经网络。它由60000幅32×32彩色图像组成,分为10个类别。这些图像是从各种来源收集的,例如网页、新闻和个人图像集。每个类别包含6000幅图像,平均分配在训练集、测试集和验证集中,使其成为测试计算机视觉和其他机器学习模型的理想图像集。
卷积神经网络和其他类型网络的主要区别在于处理数据的方式。卷积神经网络通过滤波依次检查输入数据的属性。卷积层的数量越多,可以识别的细节就越精细。在第一次卷积之后,该过程从简单的对象属性(如边或点)开始进行第二次卷积以识别详细的结构,如角、圆、矩形等。在第三次卷积之后,特征就可以表示某些复杂的模式,它们与图像中对象的某些部分相似,并且对于给定对象来说通常是唯一的。在我们最初的例子中,这些特征就是猫的胡须或耳朵。特征图的可视化(如图4所示)对于应用本身而言并不是必需的,但它有助于帮助理解卷积。
即使是像CIFAR这样的小型网络,每层也有数百个神经元,并且有许多串行连接的层。随着网络的复杂度和规模的增加,所需的权重和偏置数量也迅速增长。图3所示的CIFAR-10示例已经有20万个参数,每个参数在训练过程中都需要一组确定的值。特征图可以由池化层进一步处理,以减少需要训练的参数数量并保留重要信息。
图4.CNN的特征图
如上所述,在CNN中的每次卷积之后,通常会发生池化,在一些文献中也常被称为子采样。它有助于减少数据的维度。图4中的特征图里面的很多区域包含很少甚至不含有意义的信息。这是因为对象只是图像的一小部分,并不构成整幅图像。图像的其余部分未在特征图中使用,因此与分类无关。在池化层中,池化类型(最大值池化或均值池化)和池化窗口矩阵的大小均被指定。在池化过程中,窗口矩阵逐步在输入数据上移动。例如,最大值池化会选取窗口中的最大数据值而丢弃其它所有的值。这样,数据量不断减少,最终形成各个对象类别的唯一属性。
图3.用CIFAR-10数据集训练的CIFAR网络模型
卷积和池化的结果是大量的二维矩阵。为了实现我们真正的目标即分类,我们需要将二维数据转换成一个很长的一维向量。转换是在所谓的压平层中完成的,随后是一个或两个全连接层。全连接层的神经元类似于图2所示的结构。神经网络最后一层的输出要与需要区分的类别的数量一致。此外,在最后一层中,数据还被归一化以产生一个概率分布(97.5%的猫,2.1%的豹,0.4%的虎,等等)。
这就是神经网络建模的全过程。然而,卷积核与滤波器的权重和内容仍然未知,必须通过网络训练来确定使模型能够工作。这将在后续文章《训练卷积神经网络:什么是机器学习?——第二部分》中说明。第三部分将解释我们上文讨论过的神经网络(例如识别猫)的硬件实现,我们将使用ADI公司开发的带硬件CNN加速器的MAX78000人工智能微控制器来演示。
标签:
-
2023-04-17 16:13:14
卷积神经网络简介:什么是机器学习?——第一部分<
摘要随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本系列文章基于此解释了卷积神经网络(CNN)及
-
2023-04-17 15:25:38
从酶入手 逆转衰老<
4月12日发表于《自然》的一项研究显示,衰老似乎以同样的方式影响着5种截然不同的生命——人类、果蝇、大鼠、小鼠和蠕虫的细
-
2023-04-17 14:25:55
天天观察:5+23!福建出台激励措施推进文旅经济高质量发展<
据介绍省委办公厅和省政府办公厅近期出台了《新形势下促进文旅经济高质量发展激励措施》,主要包括5个方面23条措施。
-
2023-04-17 13:08:08
默认的谷歌搜索要被换掉了?三星手机正考虑用微软必应替代-每日头条<
财联社4月17日讯(编辑周子意)据媒体周日(4月16日)报道,韩国智能手机制造商三星电子正考虑将其设备上的默认搜索引擎替换成微软公司的必应
-
2023-04-17 12:10:48
广州鼓励符合条件的实体经济企业发起设立小贷公司;蚂蚁集团将在渝设立蚂蚁消费金融总部和蚂蚁小微企业金融科技总部<
【监管与行业政策】1、央行:优化大宗消费品和社会服务领域消费金融服务,加大金融支持就业力度4月14日,据央行官网披露,央行货币政策委员会2
-
2023-04-17 16:13:14
卷积神经网络简介:什么是机器学习?——第一部分
摘要随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本系列文章基于此解释了卷积神经网络(CNN)及
-
2023-04-17 15:25:38
从酶入手 逆转衰老
4月12日发表于《自然》的一项研究显示,衰老似乎以同样的方式影响着5种截然不同的生命——人类、果蝇、大鼠、小鼠和蠕虫的细
-
2023-04-17 14:25:55
天天观察:5+23!福建出台激励措施推进文旅经济高质量发展
据介绍省委办公厅和省政府办公厅近期出台了《新形势下促进文旅经济高质量发展激励措施》,主要包括5个方面23条措施。
-
2023-04-17 13:08:08
默认的谷歌搜索要被换掉了?三星手机正考虑用微软必应替代-每日头条
财联社4月17日讯(编辑周子意)据媒体周日(4月16日)报道,韩国智能手机制造商三星电子正考虑将其设备上的默认搜索引擎替换成微软公司的必应
-
2023-04-17 12:10:48
广州鼓励符合条件的实体经济企业发起设立小贷公司;蚂蚁集团将在渝设立蚂蚁消费金融总部和蚂蚁小微企业金融科技总部
【监管与行业政策】1、央行:优化大宗消费品和社会服务领域消费金融服务,加大金融支持就业力度4月14日,据央行官网披露,央行货币政策委员会2
-
2023-04-17 11:22:10
炫富女如何通过审核喜提公租房_全球快播报
准备材料是申请公租房的关键。需要准备的主要材料包括:1、身份证;2、户口簿;3、家庭收入证明(工资流水、纳税证明等);4
-
2023-04-17 10:34:40
韩国3月汽车出口额同比增长64%,再创历史新高 每日播报
韩国产业通商资源部周一公布的数据显示,韩国3月份汽车出口同比飙升60%以上,再创历史新高,得益于对环保汽车的强劲需求。数据显示,韩国3月汽
-
2023-04-17 09:59:26
【国际快讯】特斯拉缺席上海车展;特斯拉开启新一轮降价;传马斯克将创办新AI初创公司 环球热点评
【国际快讯】特斯拉缺席上海车展;特斯拉开启新一轮降价;传马斯克将创办新AI初创公司特斯拉缺席上海车展4月18日至27日,上海将举办2023年上海
-
2023-04-17 08:55:19
环球信息:闽侯:百亩抛荒地变增收“希望田”
海拔800多米的村庄里连片田埂高高垒起,山垅田间,春日新种下的马铃薯在大地上“画”出了一片绿色的海洋……
-
2023-04-17 07:47:43
CFG格式视频_cfg格式-环球热闻
1、修改软件时,用到了CFG文件,不知道是什么格式,上网找了些资料,放到这里。2、种文件没有固定的格式,其实也并不能算
-
2023-04-17 05:51:56
小黄鱼和黄花鱼的区别_黄鱼和黄花鱼有什么区别 世界百事通
1、黄鱼和黄花鱼是非常接近的两种鱼,黄花鱼是黄鱼的其中一个种类。2、黄花鱼虽然属于黄鱼,但是它不是黄鱼。3、黄鱼和黄花鱼
-
2023-04-17 00:58:37
环球今亮点!学历层次有哪些?学位分类哪些?_学历层次有哪些
1、学历从低到高1-小学和初中(九年义务教育)2-高中和中专(同等学力)3-大专4-本科(包含双学位)5-硕士(在读的是
-
2023-04-16 21:23:00
宜宾翠屏艾尚唐牙科怎么样?医院简介、医生信息汇总
一、宜宾翠屏艾尚唐牙科怎么样?它在当地有很长的发展历史,该院的具体地址为锦江区新光华街。它是一家综合性牙科医疗机构。经过多年的发展,这
-
2023-04-16 19:58:36
临颍2023年“县长杯”校园足球联赛开赛
“我宣布临颍2023年‘县长杯’足球联赛,现在开赛。”4月15日,临颍县委副书记、县长李俊伟宣布。据介绍,近年来,临颍县充分发挥校园足球...
-
2023-04-16 18:00:09
一汽丰田花冠优惠1.8万元 售价7.28万起-看热讯
产品名称2013款花冠1 6L自动豪华版2013款花冠1 6L自动卓越版经销商报价8 5399-11 38
-
2023-04-16 15:59:22
物联、数联、智联,北外滩积极打造善治新典范 天天快看点
北外滩街道相关负责人介绍道:“近年来,街道始终坚持人民城市理念,把城市数字化转型建设作为重点工作,全方位推进数据赋能、智能物联和应...
-
2023-04-16 14:27:30
外国友人眼中的广交会:不远万里,赴一场春天的约定-讯息
4月15日9时,广州的春日已有闷热之感。在广州国际会展中心外,人们排起“长龙”,开始进入第133届中国进出口商品交易会(
-
2023-04-16 12:12:14
青海姑娘回应陪嫁100头牦牛 基本信息讲解
大家好,今日关于【青海姑娘回应陪嫁100头牦牛】的话题登上了各大平台的热搜榜,受到全网的关注度非常高,那么【青海姑娘回应陪嫁100头牦牛
-
2023-04-16 10:58:24
琶洲港澳客运口岸迎首位“落地签”广交会海外客商
4月15日下午5时许,随着“海珠湖”号缓缓地停靠琶洲港澳客运码头,琶洲港澳客运口岸迎来了首位“落地签”的海外客商。
-
2023-04-16 08:55:54
3月份房价上涨城市个数增加,房地产开发投资降幅收窄
3月份房价上涨城市个数增加,房地产开发投资降幅收窄——楼市进一步出现积极变化国家统计局4月15日公布的3月份商品住宅销售
-
2023-04-16 07:12:28
最新快讯!76人21记三分射穿篮网季后赛开门红 哈登23+13大帝26分
76人21记三分射穿篮网季后赛开门红哈登23+13大帝26分,哈登,布里奇斯,76人队,篮网队,德文·哈里斯,约翰逊
-
2023-04-16 04:42:34
这就是信心|喜——“朋友圈”越来越广
随着一季度多项经济数据的陆续发布,2023年,中国经济在开局之季再次展现出整体向好的发展态势。这一次新华网带你换个角度看发展,从“忙”...
-
2023-04-15 23:08:36
环球热消息:海南启动“全国肿瘤防治宣传周”系列活动
4月15日,以“癌症防治全面行动”为主题的海南省第29届“全国肿瘤防治宣传周”系列活动在海南省肿瘤医院启动。海南省第29届“全国肿瘤防治...
-
2023-04-15 20:58:15
全球快报:飞行夹克,男人的“铠甲”,不开飞机也可以帅到起飞!
这年头要说一件非常经典的单品。无论外界的风怎么吹,它在时尚界的地位都岿然不动,那就是飞行员夹克了。众所周知,飞行员夹克是一件很能够显
-
2023-04-15 19:07:06
消息!赛前丨全力为深圳球迷奉献精彩表现
赛前丨全力为深圳球迷奉献精彩表现
-
2023-04-15 17:44:20
【大国基理】天津:打造基层治理样板 提升老百姓的幸福感_环球滚动
【大国基理】天津:打造基层治理样板提升老百姓的幸福感
-
2023-04-15 16:17:49
天天关注:失信案例曝光丨司法温情和司法强制:对未成年被执行人的失信惩戒需谨慎
津滨海讯(记者董欣通讯员 郝珊珊)当生效法律文书确定的义务人为未成年人履行时,如何适当地采取执行措施,既能保障未成年
-
2023-04-15 14:41:01
美职联纽约红牛vs休斯敦迪纳摩比分预测 休斯顿迪纳摩能否迎来客场首胜
北京时间4月16日早上7:00,美职联将展开多场比赛的争夺,其中纽约红牛将在主场迎接休斯顿迪纳摩的挑战。
-
2023-04-15 12:37:47
探店VR体验长安马自达CX-50,“六好”SUV名不虚传
长安马自达CX-50(参数|询价)自网上曝光以来,就一直保持着较高的关注度,就连身为汽车小编的笔者,也十分想在第一时间一睹这款山系SUV的真容。
-
2023-04-15 10:57:16
图说|拒绝爆冷!上海男篮“生死战”惊险过关,晋级八强
北京时间2023年4月14日,CBA联赛季后赛上海男篮与江苏男篮的“生死之战”在上海东方体育中心正式打响。此前两队在本轮