语义分割

语义分割

语义分割解决的问题是:对每一个像素进行分类。图片分割同样解决像素分类问题。区别在于,语义分割是监督学习,图像分割是聚类。语义分割的核心在于全连接卷积网络。

常用的语义分割数据集(VOC2012)

  1. 语义分割的数据集比较特殊,标注(label)是相应大小的图片。
  2. 一般用rand_crop来取代imresize来调整同样的大小。

全连接卷积网络(Fcn)

卷积网络中,通过卷积层和池化层来减少数据长宽增加数据通道。Fcn是将全连接层转化为卷积层,然后通过反卷积来还原输入效果达到每个像素的分类。(通过论文来进一步了解)

tips

  1. 替换全连接层和池化层成1x1卷积
  2. 添加反卷积转置到需要大小的输出
  3. 权重初始化维预先训练权重


Dense变为1x1的卷积