如何使用Mask-RCNN在实例分割应用中克服过拟合

如何使用Mask-RCNN在实例分割应用中克服过拟合，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

成都创新互联公司服务项目包括黄浦网站建设、黄浦网站制作、黄浦网页制作以及黄浦网络营销策划等。多年来，我们专注于互联网行业，利用自身积累的技术优势、行业经验、深度合作伙伴关系等，向广大中小型企业、政府机构等提供互联网行业的解决方案，黄浦网站推广取得了明显的社会效益与经济效益。目前，我们服务的客户以成都为中心已经辐射到黄浦省份的部分城市，未来相信会继续扩大服务区域并继续获得客户的支持与信任！

导读

只使用1349张图像训练Mask-RCNN，有代码。

介绍

计算机视觉的进步带来了许多有前途的应用，如自动驾驶汽车或医疗诊断。在这些任务中，我们依靠机器的能力来识别物体。

我们经常看到的与目标识别相关的任务有4个：分类和定位、目标检测、语义分割和实例分割。

如何使用Mask-RCNN在实例分割应用中克服过拟合

在分类和定位中，我们感兴趣的是为图像中目标的分配类标签，并在目标周围绘制一个包围框。在这个任务中，要检测的目标数量是固定的。

物体检测不同于分类和定位，因为这里我们没有预先假设图像中物体的数量。我们从一组固定的目标类别开始，我们的目标是分配类标签，并在每次这些类别中的一个目标出现在图像中时绘制边界框。

在语义分割中，我们为每个图像像素分配一个类标签：所有属于草的像素被标记为“grass”，属于羊的像素被标记为“sheep”。值得注意的是，例如，这个任务不会对两只羊产生区别。

我们的任务是实例分割，它建立在目标检测和语义分割之上。在目标检测中，我们的目标是在预定义的类别中标记和定位目标的所有实例。但是，我们没有为检测到的目标生成边界框，而是进一步识别哪些像素属于该目标，就像语义分割一样。与语义分割不同的是，实例分割为每个目标实例绘制一个单独的掩码，而语义分割将为同一类的所有实例使用相同的掩码。

在本文中，我们将在一个很小的Pascal VOC数据集上训练一个实例分割模型，其中只有1349张图像用于训练，100张图像用于测试。这里的主要挑战是在不使用外部数据的情况下防止模型过拟合。

数据处理

标注采用COCO格式，因此我们可以使用pycocotools中的函数来检索类标签和掩码。在这个数据集中，共有20个类别。

如何使用Mask-RCNN在实例分割应用中克服过拟合

下面是一些训练图像和相关mask的可视化显示。mask的不同阴影表示同一目标类别的多个实例的不同掩码。

如何使用Mask-RCNN在实例分割应用中克服过拟合

图像的大小和长宽比各不相同，因此在将图像输入模型之前，我们调整每个图像的尺寸500x500。当图像尺寸小于500时，我们对图像进行优化，使最大边的长度为500，并添加必要的零以获得正方形图像。

如何使用Mask-RCNN在实例分割应用中克服过拟合

为了使模型能够很好地泛化，特别是在这样一个有限的数据集上，数据增强是克服过拟合的关键。对于每一个图像，以0.5的概率水平翻转，以0.9到1倍的尺度进行随机剪裁，以0.5的概率进行高斯模糊，标准差为随机，对比度随机调整尺度为0.75和1.5之间，亮度随机调整尺度在0.8和1.2之间，以及一系列随机仿射变换如缩放、平移、旋转，剪切。

Mask-RCNN

我们使用matterport实现的Mask-RCNN进行训练。虽然结果可能会很好看，但我们不会用MS COCO的预训练权重来展示我们如何只用1349张训练图像就能得到好的结果。

Mask-RCNN是在2017年Mask-RCNN论文中提出的，是同一作者对Faster-RCNN的扩展。Faster-RCNN被广泛应用于目标检测，模型在被检测物体周围生成包围盒。Mask-RCNN进一步生成了目标的mask 。

我将在下面简要介绍模型体系结构。

如何使用Mask-RCNN在实例分割应用中克服过拟合

首先，我们使用一个主干模型从输入图像中提取相关的特征。在这里，我们使用ResNet101架构作为骨干。图像由张量(500,500,3)转换为特征图(32,32,2048)。

然后将之前获得的特征输入到一个区域建议网络(RPN)中。RPN扫描feature map的区域，称为anchors，并尝试确定包含目标的区域。这些anchor的尺寸和纵横比各不相同。RPN为每个anchor分配一个类别：前景(正样本anchor)或背景(负样本anchor)。中性anchor是指不影响训练的anchor。

如何使用Mask-RCNN在实例分割应用中克服过拟合