亚马逊云科技 AI For Good-2022 优秀方案开源分享—菜鸡小分队

Amazon SageMaker
0
0
{"value":"在刚刚结束的【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中,来自上海交通大学的菜鸡小分队团队斩获第7名。团队成员为吴杨谦和程敏敏。本次赛事聚焦遥感光学目标检测,存在图像尺寸大、目标角度各异等诸多难点,挑战难度高。为此,菜鸡小分队团队为我们分享了他们在比赛中采用的算法策略与开发体验。\n\n![1.png](https://dev-media.amazoncloud.cn/9e528bef6da5434abc4f53a27b2d095b_1.png)\n\n**Q:在解决遥感图像目标识别的问题时,想了解贵团队构建算法模型的基本思路是什么?遇到主要难点是什么?**\n\n**A**:本次训练中我们使用的训练集为 DOTA-V2.0 遥感影像数据集,其中包括了18个类别的检测目标。数据集中包括了11268张图像,共有约179万个检测目标分布在这1万多张图像中。我们的目标是对遥感影像中的旋转小目标进行检测。\n\n该目标检测问题的难点有三个:一是原图的尺寸很大,二是同一目标的尺寸也不具有一致性,三是标签分布具有非常明显的长尾效应。针对这三个问题,我们分别采取了图像切割、多尺度预测、数据扩增的方法进行解决。同时,针对旋转目标检测,我们使用了 YOLOv5 OBB 模型进行目标检测。\n\n\n**Q:针对本次比赛的图像数据尺寸较大、数据量较多,请问贵团队采用了什么方法解决这些数据处理的挑战?**\n\n**A**:我们针对 DOTA 数据集的两个特点进行了针对性的处理。第一个特点是原图具有很高的分辨率,DOTA 数据集中图像的分辨率从800*800到20000*20000不等,这么高的分辨率使得训练网络变得非常困难,针对这个问题,我们对原图进行了图像切割,将高分辨率的图像切分为若干个低分辨率的子图塞入网络进行训练,提高网络对于小目标的学习能力。\n\nDOTA 数据集的第二个特点是标签类别的分布极其不均衡,比如在所有的18个类别中,small vehicle 有123万个实例,而 helipad 只有611个实例,针对标签分布的长尾效应,我们使用了数据扩增的方法,有倾向性地提高包含 helipad 这种数目很少类别的图像数量。\n\n**Q:针对遥感图像识别,贵团队构建算法模型的基线模型是什么?**\n**A**:针对旋转小目标检测,我们使用了 YOLOv5 OBB 模型,该模型将传统的 HBB 水平框 YOLOv5 检测模型扩展为了 OBB 旋转框检测模型。它的基本机理与 YOLOv5 类似,在其中使用了 Mosaic 数据增强、自适应锚框计算、多尺度预测等技术,有效地提高了目标检测的效果。\n\n\n**Q:本次比赛是基于 Amazon Sagemaker 进行的模型搭建,贵团队在使用 Amazon Sagemaker 的过程中有哪些感受和经验?**\n**A**:Jupyter 样例多,界面人性化;在使用 SageMaker Studio 中,发现除了 Notebook 传统擅长可视化,还额外加了一些可视化组件以管理模型的实验过程,这样的使用体验就非常友好了。\n\n在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下\n\n![2.png](https://dev-media.amazoncloud.cn/4898e8783f63432d94cbbef6d775a73c_2.png)\n\n创建完成后上传 DOTA 数据集和代码就可以训练了,如下所示\n\n![3.png](https://dev-media.amazoncloud.cn/a4fdda04aabd496486b3c8a5838a0cf4_3.png)\n\n**Q:贵团队在本次大赛中获得了第7名的优秀成绩,回顾本场比赛,您有什么心得和体验?**\n\nA:本次亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛大神云集,也是本着学习的态度来参加比赛,这次比赛也收获到了非常多,很感谢亚马逊提供的参赛平台,期待下一次的参赛。","render":"<p>在刚刚结束的【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中,来自上海交通大学的菜鸡小分队团队斩获第7名。团队成员为吴杨谦和程敏敏。本次赛事聚焦遥感光学目标检测,存在图像尺寸大、目标角度各异等诸多难点,挑战难度高。为此,菜鸡小分队团队为我们分享了他们在比赛中采用的算法策略与开发体验。</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/9e528bef6da5434abc4f53a27b2d095b_1.png\" alt=\"1.png\" /></p>\n<p><strong>Q:在解决遥感图像目标识别的问题时,想了解贵团队构建算法模型的基本思路是什么?遇到主要难点是什么?</strong></p>\n<p><strong>A</strong>:本次训练中我们使用的训练集为 DOTA-V2.0 遥感影像数据集,其中包括了18个类别的检测目标。数据集中包括了11268张图像,共有约179万个检测目标分布在这1万多张图像中。我们的目标是对遥感影像中的旋转小目标进行检测。</p>\n<p>该目标检测问题的难点有三个:一是原图的尺寸很大,二是同一目标的尺寸也不具有一致性,三是标签分布具有非常明显的长尾效应。针对这三个问题,我们分别采取了图像切割、多尺度预测、数据扩增的方法进行解决。同时,针对旋转目标检测,我们使用了 YOLOv5 OBB 模型进行目标检测。</p>\n<p><strong>Q:针对本次比赛的图像数据尺寸较大、数据量较多,请问贵团队采用了什么方法解决这些数据处理的挑战?</strong></p>\n<p><strong>A</strong>:我们针对 DOTA 数据集的两个特点进行了针对性的处理。第一个特点是原图具有很高的分辨率,DOTA 数据集中图像的分辨率从800<em>800到20000</em>20000不等,这么高的分辨率使得训练网络变得非常困难,针对这个问题,我们对原图进行了图像切割,将高分辨率的图像切分为若干个低分辨率的子图塞入网络进行训练,提高网络对于小目标的学习能力。</p>\n<p>DOTA 数据集的第二个特点是标签类别的分布极其不均衡,比如在所有的18个类别中,small vehicle 有123万个实例,而 helipad 只有611个实例,针对标签分布的长尾效应,我们使用了数据扩增的方法,有倾向性地提高包含 helipad 这种数目很少类别的图像数量。</p>\n<p><strong>Q:针对遥感图像识别,贵团队构建算法模型的基线模型是什么?</strong><br />\n<strong>A</strong>:针对旋转小目标检测,我们使用了 YOLOv5 OBB 模型,该模型将传统的 HBB 水平框 YOLOv5 检测模型扩展为了 OBB 旋转框检测模型。它的基本机理与 YOLOv5 类似,在其中使用了 Mosaic 数据增强、自适应锚框计算、多尺度预测等技术,有效地提高了目标检测的效果。</p>\n<p><strong>Q:本次比赛是基于 Amazon Sagemaker 进行的模型搭建,贵团队在使用 Amazon Sagemaker 的过程中有哪些感受和经验?</strong><br />\n<strong>A</strong>:Jupyter 样例多,界面人性化;在使用 SageMaker Studio 中,发现除了 Notebook 传统擅长可视化,还额外加了一些可视化组件以管理模型的实验过程,这样的使用体验就非常友好了。</p>\n<p>在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/4898e8783f63432d94cbbef6d775a73c_2.png\" alt=\"2.png\" /></p>\n<p>创建完成后上传 DOTA 数据集和代码就可以训练了,如下所示</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/a4fdda04aabd496486b3c8a5838a0cf4_3.png\" alt=\"3.png\" /></p>\n<p><strong>Q:贵团队在本次大赛中获得了第7名的优秀成绩,回顾本场比赛,您有什么心得和体验?</strong></p>\n<p>A:本次亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛大神云集,也是本着学习的态度来参加比赛,这次比赛也收获到了非常多,很感谢亚马逊提供的参赛平台,期待下一次的参赛。</p>\n"}
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭