从2012年以来,跟着AlexNet横空出世,深度神经网络在核算机视觉范畴成为干流的办法。2014年,谷歌创造出了GoogleNet,牛津大学创造了VGGNet,2015年微软创造了ResNet,2016年康奈尔大学和清华大学创造了DenseNet,这几个结构都是环绕分类使命而创造的网络结构。
除了分类以外,在核算机视觉里边还有其它的重要使命,比方图画切割、人脸要害点的检测、人体姿势估量、方针检测等等。
下一代的网络结构是什么样的呢?是否适用于更为广泛的视觉辨认问题?
王井东首要介绍了分类网络结构,它是包含一系列减小表征空间巨细的进程,终究得到一个低分辨率的表征,然后进行分类,可是切割等使命需求空间精度高的表征,即高分辨率FBA头程表征。
学习高分辨率表征,有一种叫上采样的通用办法,包含两个过程,榜首个过程是分类的网络架构,表征开端比较大,然后渐渐变小。第二个过程,经过上采样的办法逐渐从低分辨率康复高分辨率。这样的办法获得的特征空间精度较弱。
而王井东团队研制的高分辨率网络架构(HRNet)没有沿袭曾经的分类架构,也不是从低分辨率康复到高分辨率,从头到尾保持高分辨率。
他们让高中低分辨率不停地交互,使得高分辨率能够拿到低分辨率语义性比较强的表征,低分辨率能够拿到高分辨率的空间精度比较强的表征,不停地交融,终究获得更强的高分辨率表征。
在人体姿势、切割、人脸要害点检测、方针检测等使命中,HRNet从参数量、核算量以及终究成果看,高分辨率结构都十分有优势。HRNet在人体姿势估量的使命上,现已成为规范的办法;在切割使命上,因为其更好的功用,也被我们广泛运用。雷锋网雷锋网雷锋网(大众号:雷锋网)
雷锋网原创文章,未经授权制止转载。概况见转载须知。
来源:版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知,我们会及时删除。联系QQ:110-242-789