VGG模型笔记

🦹‍♀️作者: 尹祺翔
⏲️时间: July 2, 2022 17:20:52
📒目录: CVBaseline
📑字数: 3,159
⏰预计阅读时间: 14min

CVbaseline-VGG

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

1.论文研究背景、成果及意义

ILSVRC：大规模图像识别挑战赛

ImageNet Large Scale Visual Recognition Challenge 是李飞飞等人于2010年创办的图像识别挑战赛，自2010起连续举办8年，极大地推动计算机视觉发展

比赛项目涵盖：图像分类(Classification)、目标定位(Object localization)、目标检测(Object detection)、视频目标检测(Object detection from video)、场景分类(Scene classification)、场景解析(Scene parsing)

竞赛中脱颖而出大量经典模型： alexnet，vgg，googlenet，resnet，densenet等

1.AlexNet：ILSVRC-2012分类冠军，里程碑的CNN模型

2.ZFNet： ILSVRC-2013分类冠军方法，对AlexNet改进

3.OverFeat：ILSVRC-2013定位冠军，集分类、定位和检测于一体的卷积网络方法

模型	时间	top-5-error
AlexNet	2012	15.3%
ZFNet	2013	13.5%
VGG	2014	7.3%

相关研究

1.AlexNet：ILSVRC-2012分类冠军，里程碑的CNN模型

2.ZFNet： ILSVRC-2013分类冠军方法，对AlexNet改进(改变了超参数的设置)。卷积核的数目更小，对AlexNet进行参数的改进，具体改进如图所示：

3.OverFeat：ILSVRC-2013定位冠军，集分类、定位和检测于一体的卷积网络方法，提出了全卷积的方式进行参数的预测。（全卷积）

可以在一次运算内实现多裁剪。【只需要输入一张图片】

1.AlexNet：借鉴卷积模型结构

2.ZFNet：借鉴其采用小卷积核思想

3.OverFeat：借鉴全卷积，实现高效的稠密（Dense）预测

4.NIN：尝试$1*1$卷积（network in network）

VGG-ILSVRC成绩

VGG模型笔记

CVbaseline-VGG

1.论文研究背景、成果及意义

2.摘要核心

3.VGG结构

4.VGG特点

5.训练技巧

5.1尺度扰动

5.2预训练模型

6.测试技巧

6.1Dense测试

6.2Multi-crop测试

7.结果分析

8.总结

9.核心代码实现

附：论文原文