首页  >>  电商资讯

提视频识别精度-阿里安全图灵实验室推AI新算法获国际顶会肯定

发布时间:2018-10-08 05:35:07

阿里安全图灵实验室高级算法专家析策在ECCV上介绍AI视频识别新算法

析策表示,一个视频包含帧、镜头、场景、事件等,帧与帧、镜头与镜头间拼多多空包网关系十分复杂,不仅仅是前后帧的顺序关系,而目前公开的建模方法一般都无法表达如此复杂的关系,DCGN因对复杂内容的深度学习和理解进而提升识别精度,“作为序列建模的通用方法,这种方法的使用不仅局限于视频场景,在语音识别、自然语言处理等场景都有潜在应用价值,这一方法已在阿里体系内进行了应用。”

析策表示,这一方法的主要思路是通过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事件进行多级的建模,逐渐地从帧级、镜头级,一直到视频级进行抽象,从而获得视频全局的表达,进而进行分类。

析策表示,一个视频包含帧、镜头、场景、事件等,帧与帧、镜头与镜头间拼多多空包网关系十分复杂,不仅仅是前后帧的顺序关系,而目前公开的建模方法一般都无法表达如此复杂的关系,DCGN因对复杂内容的深度学习和理解进而提升识别精度,“作为序列建模的通用方法,这种方法的使用不仅局限于视频场景,在语音识别、自然语言处理等场景都有潜在应用价值,这一方法已在阿里体系内进行了应用。”

拼多多空包网

烹饪节目中包含厨师烹饪、主持人聊天、食物、观众等内容,不同内容用不同演示边框表示,最终组合出对整个视频的理解

ECCV与CVRP、ICCV并称为计算机视觉领域拼多多空包网的三大顶会,因聚集全球技术能力的重要突破和新的方法论,被学术界和工业界高度关注。阿里安全图灵实验室高级算法专家析策表示,为提升AI技术在实际场景中针对视频识别的精度,提出一种新的基于图(Graph)的视频建模方法,能表达含有复杂事件内容的长视频,超越LSTM等序列建模方法。

实际上,越来越多的企业和个人使用各种智能设备来记录日常生活和工作的海量数据,对这些储存的海量数据的挖掘和利用一直是学术界和工业界研究的热点。近期,优酷招聘数据标注师登上热搜,其背后正是通过AI进行动作和场景识别,对视频内容分析后打标,根据用户需求进行个性化推荐。

“新零售的多个场景也在逐步落地AI视频识别技术,也证明这一技术能力的应用领域未来将会持续拓展。”阿里安全图灵实验室资深专家奥创表示,刚刚获悉实验室也在ECCV举办的首届“时尚图像生成国际竞赛”中获得冠军,已受邀在9月14日的研讨会上进行演讲,“也是组委会对我们算法能力的重要肯定。”

拼多多空包网 www.kkbbww.com

上一篇:提高店铺权重 教你几招 增加免费流量 拼多多空包网
下一篇:如何做好小众中的大众_四步走_iFashion商学院故事_攻略在此|_日涨千粉