亚马逊云科技 AI For Good-2022 优秀方案开源分享—西安欧亚信息代表队

Amazon SageMaker

{"value":"#### **01 团队介绍**\n\n\n来自西安欧亚学院的西安欧亚信息代表队斩获第5名，团队成员：柴博松、高和瑜、贾建超、雷嘉威。\n\n![1.png](https://dev-media.amazoncloud.cn/c201ce7e035f471faec6a7e6876b0f43_1.png)\n\n#### **02 算法策略**\n\n```\nnames = listdir(osp.join(DATA_DIR, CLASS, 'JPEGImages'))\n# 对文件名进行排序，以确保多次运行结果一致\nnames.sort()\nrandom.shuffle(names)\nlen_train = int(len(names)*TRAIN_RATIO)\nlen_val = int(len(names)*VAL_RATIO)\nwrite_rel_paths('train', names[:len_train], DATA_DIR)\nwrite_rel_paths('val', names[len_train:len_train+len_val], DATA_DIR)\nwrite_rel_paths('test', names[len_train+len_val:], DATA_DIR)\n# 写入类别信息\nwith open(osp.join(DATA_DIR, 'labels.txt'), 'w') as f:\nf.write(CLASS+'\\n')\n```\n\n\n① 整个赛题的解决思路以及用到的数据处理方法；\n介绍：对数据集进行切割，以[0.5 1.0 1.5]的尺度，以subsize=1024，stride=768（gap=256）的参数对图像进行切割\n尝试了Mosaic数据增强和多尺度训练\n\n② DOTAv2包含图像分辨率极高的图像，且目标尺度分布范围较广。为了确保较小目标细节信息的完整性\n```\nclasses = ('plane', 'baseball-diamond',\n'bridge', 'ground-track-field',\n'small-vehicle', 'large-vehicle',\n'ship', 'tennis-court',\n'basketball-court', 'storage-tank',\n'soccer-ball-field', 'roundabout',\n'harbor', 'swimming-pool',\n'helicopter', 'container-crane',\n'airport', 'helipad')\n```\n\n③ 统计切割后 DOTAv2 图像中的目标边框长宽比的分布，可以发现水平框和旋转框的长宽比范围也非常广，长宽比例最大接近6：1。\n\n④统计切割后 DOTAv2 图像中的类别数量占比和分布情况。DOTAv2 数据集中类别严重失衡，最大类别失衡比≈2000:1，网络的训练会被头部类别主导。\n\n⑤ 统计 DOTAv2 目标数量的分布，其平均标注实例数量远超 COCO 数据集，即使经过切割，依然有可能在图像中出现超过1000个标注实例存在的情况。这对非密集预测的检测器有较大的影响。\n\nAPPA 从以下四个方面来衡量点集框的质量:\n\n![2.png](https://dev-media.amazoncloud.cn/af1d29c4f00e47db998ed97a40c88654_2.png)\n\n(1) 分类质量：该点集与 GT 的分类损失 focal loss ；\n\n(2) 定位质量：点集生成的多边形与 GT 的 GIOU 损失；\n\n(3) 定向质量：倒角距离 (Chamfer distance)；首先对 pseudo box 和对应的 GT box 框一条边上等距离的分别采样40个点作为一个集合，形成 pseudo box 点集合和 GT 集合。倒角距离来衡量两个集合中点的距离，并将其作为该边上定向的质量分数。\n\n(4) 逐点相关性质量：这个衡量的其实是点集中的一个点与整个点集所表示的特征的关联性；ei,k 表示第 i 组自适应点的第k点特征向量；ei 表示第 i 组特征向量的平均特征。而 e*i,k和 e*i分别表示进行规范化之后的特征向量，衡量这两个特征向量的余弦距离。\n\n\n\n**动态 TOP K 标签分配：**\n\n按照质量分数排序最前面的质量最高。表示参与质量评估的所有点集，也就是和 GT 的 IOU>0.5 的点集; σ是采样率。意思很简单就是选择质量分数排在前面k的点集生成的 pseudo box 去做第二阶段的细化。\n\n#### **03 开发体验**\n\n本次赛事中，西安欧亚信息代表队团队使用了 Amazon Sagemaker notebook 进行算法模型搭建及训练。\n\n西安欧亚信息代表队团队：在机器学习中，Notebook 是很多云平台都采用的编辑形式。因为可以与代码交互，用它来开发机器学习代码是非常常见的。Sagemaker 里有丰富的计算资源以及深度学习框架，可以更好的提升训练效率。\n\n在创建好的 Notebook 中选择好算力资源，上传 DOTA V2 数据集和代码即可进行训练，如下所示：\n\n![3.png](https://dev-media.amazoncloud.cn/db061357670f4409a289f42f1033b4e0_3.png)\n\n排行榜前几的大佬们，通过模型融合以及多种训练策略，我们还要多加学习。我们会继续努力的，很感谢亚马逊云科技平台提供的这次比赛机会，毕竟这次是我们比赛第一次拿奖。","render":"<h4><a id=\"01__0\"></a>01 团队介绍</h4>\n来自西安欧亚学院的西安欧亚信息代表队斩获第5名，团队成员：柴博松、高和瑜、贾建超、雷嘉威。\n<img src=\"https://dev-media.amazoncloud.cn/c201ce7e035f471faec6a7e6876b0f43_1.png\" alt=\"1.png\" />\n<h4><a id=\"02__7\"></a>02 算法策略</h4>\n<pre><code class=\"lang-\">names = listdir(osp.join(DATA_DIR, CLASS, 'JPEGImages'))\n# 对文件名进行排序，以确保多次运行结果一致\nnames.sort()\nrandom.shuffle(names)\nlen_train = int(len(names)*TRAIN_RATIO)\nlen_val = int(len(names)*VAL_RATIO)\nwrite_rel_paths('train', names[:len_train], DATA_DIR)\nwrite_rel_paths('val', names[len_train:len_train+len_val], DATA_DIR)\nwrite_rel_paths('test', names[len_train+len_val:], DATA_DIR)\n# 写入类别信息\nwith open(osp.join(DATA_DIR, 'labels.txt'), 'w') as f:\nf.write(CLASS+'\\n')\n</code></pre>\n① 整个赛题的解决思路以及用到的数据处理方法； \n介绍：对数据集进行切割，以[0.5 1.0 1.5]的尺度，以subsize=1024，stride=768（gap=256）的参数对图像进行切割 \n尝试了Mosaic数据增强和多尺度训练\n② DOTAv2包含图像分辨率极高的图像，且目标尺度分布范围较广。为了确保较小目标细节信息的完整性\n<pre><code class=\"lang-\">classes = ('plane', 'baseball-diamond',\n'bridge', 'ground-track-field',\n'small-vehicle', 'large-vehicle',\n'ship', 'tennis-court',\n'basketball-court', 'storage-tank',\n'soccer-ball-field', 'roundabout',\n'harbor', 'swimming-pool',\n'helicopter', 'container-crane',\n'airport', 'helipad')\n</code></pre>\n③ 统计切割后 DOTAv2 图像中的目标边框长宽比的分布，可以发现水平框和旋转框的长宽比范围也非常广，长宽比例最大接近6：1。\n④统计切割后 DOTAv2 图像中的类别数量占比和分布情况。DOTAv2 数据集中类别严重失衡，最大类别失衡比≈2000:1，网络的训练会被头部类别主导。\n⑤ 统计 DOTAv2 目标数量的分布，其平均标注实例数量远超 COCO 数据集，即使经过切割，依然有可能在图像中出现超过1000个标注实例存在的情况。这对非密集预测的检测器有较大的影响。\nAPPA 从以下四个方面来衡量点集框的质量:\n<img src=\"https://dev-media.amazoncloud.cn/af1d29c4f00e47db998ed97a40c88654_2.png\" alt=\"2.png\" />\n(1) 分类质量：该点集与 GT 的分类损失 focal loss ；\n(2) 定位质量：点集生成的多边形与 GT 的 GIOU 损失；\n(3) 定向质量：倒角距离 (Chamfer distance)；首先对 pseudo box 和对应的 GT box 框一条边上等距离的分别采样40个点作为一个集合，形成 pseudo box 点集合和 GT 集合。倒角距离来衡量两个集合中点的距离，并将其作为该边上定向的质量分数。\n(4) 逐点相关性质量：这个衡量的其实是点集中的一个点与整个点集所表示的特征的关联性；ei,k 表示第 i 组自适应点的第k点特征向量；ei 表示第 i 组特征向量的平均特征。而 ei,k和 ei分别表示进行规范化之后的特征向量，衡量这两个特征向量的余弦距离。\n动态 TOP K 标签分配：\n按照质量分数排序最前面的质量最高。表示参与质量评估的所有点集，也就是和 GT 的 IOU>0.5 的点集; σ是采样率。意思很简单就是选择质量分数排在前面k的点集生成的 pseudo box 去做第二阶段的细化。\n<h4><a id=\"03__66\"></a>03 开发体验</h4>\n本次赛事中，西安欧亚信息代表队团队使用了 Amazon Sagemaker notebook 进行算法模型搭建及训练。\n西安欧亚信息代表队团队：在机器学习中，Notebook 是很多云平台都采用的编辑形式。因为可以与代码交互，用它来开发机器学习代码是非常常见的。Sagemaker 里有丰富的计算资源以及深度学习框架，可以更好的提升训练效率。\n在创建好的 Notebook 中选择好算力资源，上传 DOTA V2 数据集和代码即可进行训练，如下所示：\n<img src=\"https://dev-media.amazoncloud.cn/db061357670f4409a289f42f1033b4e0_3.png\" alt=\"3.png\" />\n排行榜前几的大佬们，通过模型融合以及多种训练策略，我们还要多加学习。我们会继续努力的，很感谢亚马逊云科技平台提供的这次比赛机会，毕竟这次是我们比赛第一次拿奖。\n"}

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家