AlexNet模型笔记

🦹‍♀️作者: 尹祺翔
⏲️时间: June 30, 2022 0:37:16
📒目录: CVBaseline
📑字数: 2,569
⏰预计阅读时间: 10min

CVbaseline-AlexNet笔记

AlexNet : ImageNet Classification with Deep Convolutional Neural Networks

模型结构设计：ReLU，LRN，Overlapping pooling，双GPU训练

减轻过拟合：图像增强，DropOut

ILSVRC

卷积核可视化

1.研究背景

常见的图像分类数据集：

ILSVRC：大规模图像识别挑战赛

ImageNet Large Scale Visual Recognition Challenge 是李飞飞等人于2010年创办的图像识别挑战赛，自2010起连续举办8年，极大地推动计算机视觉发展。

比赛项目涵盖：

图像分类(Classification)

目标定位(Object localization)

目标检测(Object detection)

视频目标检测(Object detection from video)

场景分类(Scene classification)

场景解析(Scene parsing)

竞赛中脱颖而出大量经典模型： Alexnet，VGG，GoogleNet，ResNet，DenseNet等

ImageNet 数据集包含 21841 个类别，14,197,122张图片其通过WordNet对类别进行分组，使数据集的语义信息更合理，非常适合图像识别ILSVRC-2012 从ImageNet中挑选1000类的1,200,000张作为训练集。

Top5 error的含义：

AlexNet网络的成果：

2.研究成果和意义

AlexNet在ILSVRC-2012以超出第二名10.9个百分点夺冠

SIFT+FVS：ILSVRC-2012 分类任务第二名

1CNN ：训练一个AlexNet

5CNNs ：训练五个AlexNet取平均值

AlexNet模型笔记

CVbaseline-AlexNet笔记

1.研究背景

2.研究成果和意义

3.论文结构

4.摘要

5.网络结构

5.1RELU

5.2LRN

5.3Overlapping Pooling

6.训练技巧

6.1Data Augmentation

6.2DropOut

7.实验结果及分析

8.总结

9代码

9.1关键函数

论文原文