近日,在国际顶级赛事Pascal VOC挑战赛目标检测 comp4上,来自中国的搜狗视觉研究团队获得了第一名的成绩,其single model和ensemble model均展现出了具有明显优势的精准度,刷新了此前的世界最好成绩,彰显了搜狗在人工智能领域的领先地位与技术积累。
AI视觉,图像识别领域的“华山论剑”
PASCAL VOC挑战赛是全球计算机视觉领域知名的数据库和权威赛事,其数据集标注质量高、场景复杂、目标多样、检测难度大,是快速检验算法有效性的首选。在计算视觉领域,Pascal VOC挑战赛与ImageNet同为世界顶级的比赛,是国内外AI公司竞相展开激烈竞争的主赛场。截至目前,PASCAL VOC挑战赛吸引了全球近百支专业队伍参赛,包括Facebook、谷歌、微软研究院、CMU(美国卡耐基-梅隆大学)、清华大学、阿里、平安等国内外语音合成领域的顶尖团队。
PASCAL VOC的数据集包括 20 个类别:人类,动物(鸟、猫、牛、狗、马、羊),交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车),室内物体(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。其中,搜狗视觉研究团队参加了Object Detection(Competition4)子任务,在20类不同的目标上获得了大多数的最优结果,体现了参赛团队的模型设计和技术功底。
用实力说话,搜狗正在领跑AI 赛道
在计算视觉领域,Pascal VOC挑战赛,与ImageNet和COCO(Common Objects in Context)同为世界顶级的比赛。而作为一家中国科技公司,搜狗在目标检测技术上的研发和突破,对于整个AI行业格局的变革,都有着非常深远的影响。
而在搜狗的AI战略蓝图之中,以语言为核心,大数据和深度学习是技术的引擎,语音和图像则是其感知系统的重要构成,也是围绕语言的交互方式。因此,搜狗视觉研究团队长期专注于场景文字检测识别、人脸识别、图像细粒度分类、敏感图像检测、图像理解等前沿领域研究,并取得不错的突破。
通过近一年的算法积累与迭代,搜狗目前已经建立了一套高效易用的通用检测分割框架,可以针对任务快速迁移算法模型,达到实际应用需求。而除了VOC外,搜狗在包括CVPR2018 WAD和Cityscapes的赛事中取得了优秀的成绩,这充分表明搜狗的通用检测分割框架已基本成熟,可高效复用到各任务场景中,满足实际的需求。
目前,搜狗视觉研究的相关成果已广泛应用于搜狗旅行翻译宝、搜狗翻译APP、搜狗输入法、搜狗汪仔答题助手、搜狗识图等产品,在众多垂直领域及具体场景中满足着广大用户日益多样化、个性化的应用需求。除此之外,搜狗的图像识别技术通过AI开放平台,正在为金融、保险、医疗等行业客户提供优质的AI服务和解决方案,为用户带来切身的安全与便利体验。相信在未来,搜狗的人工智能技术一定还能带给我们更多的惊喜。