13层网络拿下83%精度,华为诺亚新型神经网络架构VanillaNet「简约」到极致
2023-05-28 14:35:51 来源:机器之心
机器之心专栏

机器之心编辑部

深度学习模型架构越复杂越好吗?

自过去的几十年里,人工神经网络取得了显著的进展,这归功于一种理念:增加网络的复杂度可以提高性能。从 AlexNet 引爆了深度学习在计算机视觉的热潮后,研究者们为了提升深度网络的性能,精心地设计出了各种各样的模块,包括 ResNet 中的残差,ViT 中的注意力机制等。然而,尽管深层的复杂神经网络可以取得很好的性能,但他们在实际应用中的推理速度往往会受到这些复杂操作的影响而变慢。

来自华为诺亚、悉尼大学的研究者们提出了一种极简的神经网络模型 VanillaNet,以极简主义的设计为理念,网络中仅仅包含最简单的卷积计算,去掉了残差和注意力模块,在计算机视觉中的各种任务上都取得了不俗的效果。13 层的 VanillaNet 模型在 ImageNet 上就可以达到 83% 的精度,挑战了深度学习模型中复杂设计的必要性。


(相关资料图)

论文地址:/abs/

代码地址:/huawei-noah/VanillaNet

极简网络的架构设计

图 1. 6 层的 VanillaNet 结构示意图

图 1 展示了 6 层的 VanillaNet 的结构,它的结构十分简洁,由 5 个卷积层,5 个池化层,一个全连接层和 5 个激活函数构成,结构的设计遵循 AlexNet 和 VGG 等传统深度网络的常用方案:分辨率逐渐缩小,而通道数逐渐增大,不包含残差,自注意力等计算。

然而,如此简单的神经网络结构真的可以达到 SOTA 的精度吗?从过往的经验来看,AlexNet 和 VGG 等网络由于难以训练,精度低等特性早已被抛弃。而如何提升这类网络的精度,是一个需要解决的难关。

极简网络的训练方案

作者认为,VanillaNet 的瓶颈主要在于由于其层数少带来的非线性差的问题,作者基于此观点,首先提出了深度训练策略来解决这一问题。

针对 VanillaNet 中的一个卷积层,深度训练策略提出将其拆分为两个卷积层,从而增加其非线性,然而,将一层拆分成两层会显著增加网络的计算量和复杂度,因此,作者提出只需在训练时增加网络层数,在推理时将其融合即可。具体来说,被拆分为两层的卷积会使用如下的激活函数:

是由一个传统非线性激活函数(如 ReLU 等)和恒等映射加权得到。在网络训练的初始阶段,非线性激活函数会占主导地位,使得网络在开始训练时具有较高的非线性,在网络训练的过程中,恒等映射的权值会逐渐提升,此时该激活函数会逐渐变为线性的恒等映射,通过以下公式简单推导:

不具有非线性激活的两个卷积层就可以被融合为一层,从而达到了” 深层训练,浅层推理 “的效果。

此外,作者还提出了一种基于级数启发的激活函数,来进一步增加网络非线性,具体的,假设 为任意现有的非线性激活函数,级数激活函数通过对激活函数进行偏置和加权,得到多个激活函数的叠加,从而使得单个激活函数具有更强的非线性:

作者对这一形式又进行了改进,使得该激活函数可以学习到全局信息而非单个输入点的信息:

作者认为,可以通过提出这两个改进方案,增加网络的非线性,从而使得极简网络也具有媲美甚至超越复杂网络的精度。

极简网络的威力

为了证明 VanillaNet 的有效性,作者在计算机视觉的三大主流任务:图像分类、检测和分割上进行了实验。

作者首先验证了提出的深度训练方案和级数激活函数的有效性:

表 1 极简网络在图像分类的性能

从上表中可以看到,所提出的两个方案可以大幅提升 VanillaNet 的精度,在 ImageNet 上有数十个点的提升,此外,作者还在 AlexNet 这种传统网络上也进行了实验,效果提升依旧十分惊艳,这证明了简单的网络设计只要通过精心的设计和训练,仍然具有强大的威力。而对于 ResNet50 这类复杂网络来说,本文提出的设计方案收效甚微,说明这类方案对于简单的网络更为有效。

表 2 极简网络在图像分类的性能

残差模块在 VanillaNet 这种简单的网络中是否还奏效?作者同样针对这一问题进行了实验,实验表明,不管是采用 ResNet 本身的残差方案还是改进后的 PreAct-ResNet 残差方案,对于 VanillaNet 来说都没有提升,这是否说明了残差网络不是深度学习的唯一选择?这值得后续研究者们的思考。作者的解释是由于 VanillaNet 的深度较少,其主要瓶颈在于非线性而非残差,残差反而可能会损害网络的非线性。

接下来,作者对比了 VanillaNet 和各类经过复杂设计的网络在 ImageNet 分类任务上的精度。

表 3 极简网络在图像分类的性能

可以看到,所提出的 VanillaNet 具有十分惊艳的速度和精度指标,例如 VanillaNet-9 仅仅使用 9 层,就在 ImageNet 上达到了接近 80% 的精度,和同精度的 ResNet-50 相比,速度提升一倍以上( . ),而 13 层的 VanillaNet 已经可以达到 83% 的 Top-1 准确率,和相同精度的 Swin-S 网络相比速度快 1 倍以上。尽管 VanillaNet 的参数量和计算量都远高于复杂网络,但由于其极简设计带来的优势,速度反而更快。

图 2 极简网络在图像分类的性能

图 2 更直观的展示了 VanillaNet 的威力,通过使用极少的层数,在 batch size 设置为 1 的情况下,VanillaNet 可以达到 SOTA 的精度和速度曲线。

表 4 极简网络在检测和分割任务的性能

为了进一步显示 VanillaNet 在不同任务的能力,作者同样在检测和分割模型上进行了实验,实验表明,在下游任务上,VanillaNet 也可以在同精度下具有更好的 FPS,证明了 VanillaNet 在计算机视觉中的潜力。

总结来说,VanillaNet 是一种十分简洁但强大的计算机视觉网络架构,使用简单的卷积架构就可以达到 SOTA 的性能。自从 Transformer 被引入视觉领域后,注意力机制被认为是十分重要且有效的结构设计,然而 ConvNeXt 通过更好的性能重振了卷积网络的信心。那么,VanillaNet 是否可以引发无残差网络、浅层网络等设计 “文艺复兴” 的浪潮?让我们拭目以待。

©THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@

13层网络拿下83%精度,华为诺亚新型神经网络架构VanillaNet「简约」到极致

2023-05-28

《西游ABC》IGN 8分:吴彦祖演技精湛 神话故事迷人

2023-05-28

马斯克回应多年前嘲笑比亚迪:如今,他们的汽车极具竞争力

2023-05-28

环球信息:化脓性中耳炎用什么抗生素_化脓性中耳炎用什么药

2023-05-28

如何下载文件传输助手到微信_微信下载文件在手机哪个文件夹_当前速看

2023-05-28

武汉方言常用语20集_武汉方言常用语

2023-05-28

环球微动态丨艳势番讲的什么故事_艳势番花九卿结局如何

2023-05-28

全球资讯:国产大飞机来了!C919今天开启首次商业载客飞行

2023-05-28

13分,拜仁是本赛季德甲下半程领先情况下丢分最多的球队 每日热讯

2023-05-28

世界热点!记者:蓉城的成绩主要是靠同行衬托 中场推不起来&建议抢戴伟浚

2023-05-28

全新凯迪拉克GT4正式发布|当前视讯

2023-05-28

世界热推荐:吾爱大神开发,无须付费可实现批量!

2023-05-28

oppo手机忘记账号密码_oppo手机忘记锁屏密码怎么解锁-全球热消息

2023-05-28

3 无重复字符的最长子串|环球快看点

2023-05-27

最好的自己更好的你_对于最好的自己更好的你简单介绍_当前聚焦

2023-05-27

即时焦点:包头铝业财务部对2022年度工会经费使用情况开展专项审查

2023-05-27

箭头消消消方块官网在哪下载 最新官方下载安装地址

2023-05-27

环球微动态丨雅阁的底盘高度是多少(8代雅阁打方向底盘响是什么原因?)

2023-05-27

每日短讯:骑马与砍杀作弊代码商店_骑马与砍杀作弊代码

2023-05-27

每日视点!一亩田“减肥”又增收 种植户感受智慧化种田“乐趣”

2023-05-27

首列甘肃酒泉(敦煌)铁海国际联运班列成功开行_天天速看

2023-05-27

荆州公租房拆迁律师费用一般怎么计算

2023-05-27

佳能单反如何同macbook(单反自带的数据线连接到电脑)

2023-05-27

大鹏新区人才企业服务中心迎来首批入驻团队 最新资讯

2023-05-27

零工小市场 服务就业大民生

2023-05-27

乐园魔城汉化版下载教程(乐园魔城汉化版下载)-天天热资讯

2023-05-27

“大学生掏鸟案”当事人已经出狱返回家中 环球播报

2023-05-27

如何在10分钟骗走430万?

2023-05-27

车展维权女车主告特斯拉案败诉,女车主回应:将上诉,另一案已胜诉 即时看

2023-05-27

环球报道:五粮液总经理蒋文格:今年持续补短强弱固优 保持两位数稳健增长

2023-05-27

今日热门!科学管理研究 人大经济论坛_人大经济学论坛

2023-05-27

南方迎今年首轮大范围高温闷热天金十期货5月26日讯,5月25日,受副热带高压北抬影响,南方大部气温陆续回升 世界快消息

2023-05-27

公司有产品有涉及机器人零部件吗?华亚智能:公司目前的产品尚未应用到该领域

2023-05-27

五华区2023年二季度23个项目集中开工

2023-05-27

新华社|撑到那一刻——专访新科世界棋王丁立人

2023-05-27

美债即将违约,麦卡锡想找中国借钱,拜登没开口,我们要帮忙吗?

2023-05-27

强大视效搭配硬核参数:“先看评测”眼中的三星玄龙骑士OLED G9显示器

2023-05-27

twitch注册密码一直转圈_twitch注册|当前信息

2023-05-26

全球今日讯!万事利携手无界AI 探索AIGC产业应用

2023-05-26

状态火热!杰伦-布朗上半场11中6&三分5中3 得到15分2板2助2断

2023-05-26

金鑫绿建取得2022年深圳市专精特新中小企业电子证书 天天头条

2023-05-26

全球观点:小鹏首款 MPV 命名为 X9!溜背式造型 预计 34 万起售

2023-05-26

环球热文:黑马逼平曼城,哈兰德哑火

2023-05-26

探讨我国儿童罕见病临床诊治与研究新进展,这场会议在沪召开 全球报资讯

2023-05-26

推动“1到100”的跨越式发展 长三角崛起生物医药产业“新基建”高地

2023-05-26

华晨宝马扎根中国20年 引领中国汽车产业高质量发展

2023-05-26

荣威RX5系列新车全新前格栅设计概念图曝光_焦点讯息

2023-05-26

全球快看:去开封博物馆需要提前预约吗

2023-05-26

普通人想要穿出时尚感,不如先备好这三款夏季单品,简约不过时 今日热搜

2023-05-26

海绵宝宝头像四人沙雕搞笑_海绵宝宝头像四人

2023-05-26

贝勒大学后场核心试训湖人,他可能是双向合同的潜在目标?

2023-05-26

东方快评丨恶意“甩团”的“如意算盘”还要打多久 环球微资讯

2023-05-26

环球视讯!T-Mobile是有史以来最荒谬的销售之�

2023-05-26

“低头族”经常头晕 可能是交感神经型颈椎病

2023-05-26

柳絮简笔画怎么画_柳絮简笔画_环球快消息

2023-05-26

天风证券:人工智能快速发展有望催生定制化SoC市场

2023-05-26

环球热头条丨红酒aop是什么级别

2023-05-26

岩棉容重国家标准允许上下浮动_岩棉容重国家标准_环球播报

2023-05-26

天天头条:精细不麻烦,“新时尚”越来越受认同

2023-05-26

new york city怎么读?_york city 怎么读

2023-05-26

营销渠道策略分析_营销渠道策略 每日视讯

2023-05-26

全球关注:psv神秘海域黄金深渊_神秘海域黄金深渊

2023-05-26

2023青岛国际啤酒节儿童创绘征集活动规则|每日播报

2023-05-26

世界最资讯丨在200多位军阀中脱颖而出,李渊究竟凭借什么建立了大唐王朝?

2023-05-26

新华时评丨莫让舌尖消费变浪费

2023-05-26

@新疆年轻人 在家刷酸对付痘痘,很容易变成敏感肌|全球热点评

2023-05-26

环球微动态丨网贷再次逾期会怎么样?挂账停息影响信用吗?

2023-05-25

观热点:mac版本的ps快捷键_mac版本

2023-05-25

最新:电力赋能“庭院经济” 优质服务助山西乡村振兴

2023-05-25

深圳市奋达职校晋升广东省重点中等职业学校-每日短讯

2023-05-25

祥龙电业:目前公司主营规模较小,公司将继续努力经营,早日实现做大做强

2023-05-25

给抗老精华做抗老测试?Y2K 女孩操刀实验,深扒日常 VC 活性变化!_焦点速递

2023-05-25

科尔维尔:德泽尔比把我们带到了另一个高度,非常喜欢在这踢球_动态

2023-05-25

全球即时看!苏珊米勒 今日星座运势查询5.25

2023-05-25

调查:超过90%日本企业对出生率下降感到有危机感

2023-05-25

焦点要闻:5月25日包装印刷行业十大熊股一览

2023-05-25

华策爱奇艺合资公司注销|最新

2023-05-25

提能力 转作风 抓落实丨鹤岗,高分答卷的背后 全球简讯

2023-05-25

保护绿水迎亚运!杭州这个街道的护水志愿者们在行动 聚焦

2023-05-25

优秀班干部奖状是什么意思_优秀班干部奖状 天天观焦点

2023-05-25

如何铺设户外酒吧_送给妈妈的礼物手工 焦点热讯

2023-05-25

木林森董秘回复:关于公司高级管理人员的任免情况请以公司在指定披露媒体公开披露信息为准 当前报道

2023-05-25

厄尔尼诺或卷土重来 温室气体排放上升 高温气候对多国经济活动威胁加深-天天微头条

2023-05-25

研究人员瞄准可以减缓肌肉萎缩症的蛋白质

2023-05-25

海南省将建立自建房施工安全事故约谈制度-当前聚焦

2023-05-25

亲子鉴定的流程和费用是什么?亲子鉴定需要什么证件和材料?

2023-05-25

天天播报:概伦电子05月24日获沪股通增持1.48万股

2023-05-25

LPL:Theshy跟大神打游戏,直接玩成了人机局,实力差距太大了! 天天快消息

2023-05-25

浙江龙盛(600352):5月24日北向资金增持76.99万股

2023-05-25

当前热文:胃热有什么办法治疗_胃热的症状及治疗

2023-05-25

“鼓浪琴韵,奏响世遗”第十一届鼓浪屿钢琴艺术周即将举行_速看料

2023-05-25

每日资讯:武汉热爱创意广告有限公司

2023-05-25

河南税务有奖发票截止日期是什么时候?_每日关注

2023-05-25

快看点丨门博会千万不要来看一宅怡墅,看完就要回去砸店

2023-05-25

许仰天:他白手起家,39岁身价12位数

2023-05-25

220斤女子突变“小黄人”原是胰腺癌 医生在脂肪包裹“盲区”精准施术除危机 全球观天下

2023-05-25

天天观察:罗普特:拟回购不低于3000万元且不超过6000万元公司股份

2023-05-24

全球热消息:小刀是什么梗_小刀解释

2023-05-24

王心凌男孩是什么梗_坚强男孩张智霖是什么梗 今日最新

2023-05-24

呼和浩特市气象台发布大风蓝色预警|全球视讯

2023-05-24