10月27日-11月2日,在ICCV 2019 Workshop举办的 Vision Meets Drone: A Challenge(简称:VisDrone 2019)挑战赛上,云从科技研究院与中科院信息工程研究所葛仕明研究员团队(以下简称“联合研究团队”)获得了Task3“单目标跟踪挑战(Single Object Tracking, SOT)”冠军,再次刷新此项目的世界纪录。
这是继今年三月份跨镜追踪(ReID)、3D人体重建技术、自然语言处理技术分别创造世界纪录后,云从科技在人工智能领域再一次领跑全球。同时,这也是云从科技第十四次获得世界冠军。
VisDrone2019 挑战赛
ICCV 2019国际计算机视觉大会由 IEEE 主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,属于CCF A 类会议。
此次VisDrone 2019(无人机目标检测)挑战赛,要从无人机获取的视觉数据中进行物体检测和跟踪,吸引了来自海内外知名高校、科研机构和企业,包括中科院、清华大学、马里兰大学、伊利诺伊大学厄巴纳-香槟分校、云从科技、三星研究院等近百支队伍参赛。
本届挑战赛包含了四个任务,联合研究团队参加了“任务3:单目标跟踪挑战”,最后在众多参赛队中脱颖而出获得冠军。
VisDrone 2019数据集由天津大学机器学习与数据挖掘实验室的AISKYEYE团队收集,全部基准数据集由无人机捕获,包括288个视频片段,总共包括261908帧和10209个静态图像。
这些帧由260多万个常用目标(如行人、汽车、自行车和三轮车)的手动标注框组成。为了让参赛队伍能够更有效地利用数据,数据集还提供了场景可见性、对象类别和遮挡等重要属性。
因此,本届赛题难点诸多。联合研究团队在“任务3:单目标跟踪挑战”中,不仅要处理训练集、验证集、测试集等大量数据,还要克服数据中的低分辨率、长期遮挡、相机运动模糊等困难。
任务3:单目标跟踪挑战
创造世界新纪录
经过反复训练与测试,联合研究团队最终提出了改进的精确目标状态估计算法:ED-ATOM。方法里面包含两个模块:目标估计和物体分类。
其中,目标估计模块使用IOU预测网络、ResNet-18网络和ImageNet等数据集来做预训练,同时使用低光照图像增强算法处理原始数据,离线精调模型后再在线基于跟踪状态的搜索策略改进鲁棒性。
物体分类模块则使用数据增强的方法,进行在线数据扩充,以便于分类模型的可推广性。同时基于跟踪状态的有效搜索策略,改进稳健性。
最终,结合IE(图像增强)、ED(通过增强数据训练的IOU预测网络)、DA(在线数据增强)、LT(长期跟踪)几种方法的ED-ATOM算法,取得了最优成绩,刷新了世界纪录。
运用微光图像增强方法实行暗部追踪训练,通过不同方法的测试,确定效果最佳方案;
运用数据扩充方案,在目标外观发生变化的情况下,通过翻转、平移、缩放、仿射、旋转、模糊等增强方法,提高跟踪自适应性;
在面对严重的不在视野和完全遮挡的跟踪情况下,使用长期跟踪方案,可以自适应搜索区域,提高跟踪稳健性。
通过ED-ATOM算法,我们可以实现在低分辨率、长期遮挡、摄像机运动/运动模糊等情况下的有效可视化,从而达到锁定目标、预判行动等效果。
高质量跟踪分数
该成果的取得是联合研究团队共同的努力,始终坚持人工智能在实际场景运用中的技术研究与创新。云从科技孵化自中科院重庆研究院,与中科院可谓一脉相承。
作为人工智能领域的智能服务领军企业,云从科技吸引并拥有全球最优秀的人才。在广州、重庆、上海、苏州、成都等地都成立了研发中心,研发人员超过1000名,提供了核心技术产品研发能力。同时与各大学、研究院等成立联合实验室,掌握最前沿的核心技术研发能力。雄厚的人才与技术储备,为云从科技再次创造世界纪录提供强大动力。
追求技术创新的同时,云从科技始终坚持技术场景化的落地应用。ED-ATOM算法的提出,对今后安防侦测、行人跟踪、安全检测等方面的产品研发,将发挥更有价值的作用。
例如在智能安防方面,云从科技研发的智能安防管理系统是一套以人为核心的基于物联网、人工智能和大数据技术的智能化应用系统。新算法的融合,让可能的移动端(无人机或者自主系统)上得到应用的机会大大提升。
随着无人机作为视觉数据采集设备已快速而广泛的部署到城市、农业、航空等应用领域,对无人机平台收集的视觉数据进行分析和理解的需求变得愈发迫切。云从科技参与单目标跟踪挑战赛的成果,不仅对计算机视觉甚至人工智能技术是进一步的推动,也对视频监控、人机交互、自动驾驶、虚拟现实等场景都具有重要意义。
今后,云从科技将继续以人工智能技术与人机协同平台为基础,通过行业领先的人工智能、认知计算与大数据技术形成的整合解决方案,促进泛在智能下的未来城市建设。