亚马逊云科技 AI For Good-2022 优秀方案开源分享—OC

Amazon SageMaker
0
0
{"value":"在刚刚结束的【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中,来自浙江大学的金润杰率领的OC团队斩获第2名。本次赛事聚焦遥感光学目标检测,存在图像尺寸大、目标角度各异等诸多难点,挑战难度高。我们对OC团队进行了采访,邀请他们分享参赛体验与算法策略。\n\n![1.png](https://dev-media.amazoncloud.cn/facae9e1aaf54c199486b4e3ffeba48d_1.png)\n\n**Q:针对本次比赛的图像数据尺寸较大、数据量较多,请问贵团队采用了什么方法解决这些数据处理的挑战?**.\n**A**:我们的解决思路是 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 开源预训练模型 + SWA;切图训练,单张图片大小1024*1024,gap=200,在线数据增强使用随机翻转和随机旋转。\n\n\n\n**Q:能进一步介绍一下贵团队所构建算法模型吗?**\n\n**A**:RoI Transformer 用于二阶检测器中。它由两部分组成:第一部分是RRoI Learner,它学习从 HRoIs 到 RRoIs 的转换;第二部分是 RRoI Warping,它从 RRoI 中提取旋转不变的特征,用于后续的分类和回归子任务。\n\n为了进一步提高效率,模型原作者为所有的 RoI-wise operations 采用了 light head structure。roi-wise operation 一直是二阶检测器的效率瓶颈,因为它们之间的计算不共享。\n\nLight-head R-CNN 提出使用分离卷积来获得 thin feature 以解决这个问题,它还使用 PS RoI pooling 来进一步削减特征图的通道数,本文方法的 baseline 就是 Light-head R-CNN。\n\n![2.png](https://dev-media.amazoncloud.cn/294b0ce1fd7b4b759107bc31ec758880_2.png)\n图1 核心算法设计\n\n**Q:本次比赛是基于Amazon Sagemaker进行的模型搭建,贵团队在使用Amazon Sagemaker的过程中有哪些感受和经验?**\n\n**A**:Sagemaker 系统资源丰富,无需任何投入即可马上开始使用 Amazon SageMaker。每月可获得 250 个小时的 t2.medium 记事本实例使用额度,50 个小时的 m4.xlarge 训练用实例使用额度,外加 125 个小时的 m4.xlarge 托管用实例使用额度。不仅提供了不同层次、不同性能的加速计算服务器,而且配置了多种框架和镜像,训练省时省力。\n\n在实际部署的时候,我们在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下\n\n![3.png](https://dev-media.amazoncloud.cn/88494d9ac40d40ebaf791c59a10146b5_3.png)\n\n随后在创建 notebook 进行训练,如下所示\n\n![4.png](https://dev-media.amazoncloud.cn/c5a789d43ecb4424ae043c64f06da100_4.png)\n\n**Q:贵团队在本次大赛中获得了第二名的优秀成绩,回顾本场比赛,您有什么心得和体验?**\n\n**A**:我们以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 开源预训练模型 + SWA 为解决思路,较好地平衡了计算速度和计算精度,实现了算法效率的提升,我想这也是我们能够获得较好分数的核心原因。同时 Amazon Sagemaker 为我们的模型训练提供了充足的计算资源和运行环境,对初次使用 Amazon Sagemaker 的我们来说十分友好,减少了代码编写和训练调优的阻碍。最后希望我们团队的算法思路能够帮助广大开发者朋友启发思路,也建议各位开发同学尝试使用 Amazon Sagemaker 搭建项目。","render":"<p>在刚刚结束的【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中,来自浙江大学的金润杰率领的OC团队斩获第2名。本次赛事聚焦遥感光学目标检测,存在图像尺寸大、目标角度各异等诸多难点,挑战难度高。我们对OC团队进行了采访,邀请他们分享参赛体验与算法策略。</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/facae9e1aaf54c199486b4e3ffeba48d_1.png\" alt=\"1.png\" /></p>\n<p><strong>Q:针对本次比赛的图像数据尺寸较大、数据量较多,请问贵团队采用了什么方法解决这些数据处理的挑战?</strong>.<br />\n<strong>A</strong>:我们的解决思路是 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 开源预训练模型 + SWA;切图训练,单张图片大小1024*1024,gap=200,在线数据增强使用随机翻转和随机旋转。</p>\n<p><strong>Q:能进一步介绍一下贵团队所构建算法模型吗?</strong></p>\n<p><strong>A</strong>:RoI Transformer 用于二阶检测器中。它由两部分组成:第一部分是RRoI Learner,它学习从 HRoIs 到 RRoIs 的转换;第二部分是 RRoI Warping,它从 RRoI 中提取旋转不变的特征,用于后续的分类和回归子任务。</p>\n<p>为了进一步提高效率,模型原作者为所有的 RoI-wise operations 采用了 light head structure。roi-wise operation 一直是二阶检测器的效率瓶颈,因为它们之间的计算不共享。</p>\n<p>Light-head R-CNN 提出使用分离卷积来获得 thin feature 以解决这个问题,它还使用 PS RoI pooling 来进一步削减特征图的通道数,本文方法的 baseline 就是 Light-head R-CNN。</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/294b0ce1fd7b4b759107bc31ec758880_2.png\" alt=\"2.png\" /><br />\n图1 核心算法设计</p>\n<p><strong>Q:本次比赛是基于Amazon Sagemaker进行的模型搭建,贵团队在使用Amazon Sagemaker的过程中有哪些感受和经验?</strong></p>\n<p><strong>A</strong>:Sagemaker 系统资源丰富,无需任何投入即可马上开始使用 Amazon SageMaker。每月可获得 250 个小时的 t2.medium 记事本实例使用额度,50 个小时的 m4.xlarge 训练用实例使用额度,外加 125 个小时的 m4.xlarge 托管用实例使用额度。不仅提供了不同层次、不同性能的加速计算服务器,而且配置了多种框架和镜像,训练省时省力。</p>\n<p>在实际部署的时候,我们在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/88494d9ac40d40ebaf791c59a10146b5_3.png\" alt=\"3.png\" /></p>\n<p>随后在创建 notebook 进行训练,如下所示</p>\n<p><img src=\"https://dev-media.amazoncloud.cn/c5a789d43ecb4424ae043c64f06da100_4.png\" alt=\"4.png\" /></p>\n<p><strong>Q:贵团队在本次大赛中获得了第二名的优秀成绩,回顾本场比赛,您有什么心得和体验?</strong></p>\n<p><strong>A</strong>:我们以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 开源预训练模型 + SWA 为解决思路,较好地平衡了计算速度和计算精度,实现了算法效率的提升,我想这也是我们能够获得较好分数的核心原因。同时 Amazon Sagemaker 为我们的模型训练提供了充足的计算资源和运行环境,对初次使用 Amazon Sagemaker 的我们来说十分友好,减少了代码编写和训练调优的阻碍。最后希望我们团队的算法思路能够帮助广大开发者朋友启发思路,也建议各位开发同学尝试使用 Amazon Sagemaker 搭建项目。</p>\n"}
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭
contact-us