墨西哥开始接种中国科兴新冠疫苗 综合消息:突尼斯变异新冠病毒系本土演化而来 中东多国加快疫苗接种进程 长春大众卓越女足昆明集中 开启第二阶段冬训备战新赛季 “春风行动”全面启动 研考初试成绩本月陆续发布 长春市文庙博物馆将举办元宵节线上公益文化活动 美失业率上升“新穷人”领救济 记者探访救济食品分发站 起步就是冲刺!牛年伊始长春多个项目火热开工! 吉林省全力抓好煤矿安全生产监管 全国大部分农区陆续忙碌起来 田间地头一派生机盎然 3天3夜跑了500公里!成都大叔完成极限超跑挑战 4天致8次高铁晚点:铁路部门提醒放风筝远离铁路电力网 26日天宇见证浪漫一幕:"元宵月"巧遇"黄帝星" 猜灯谜、做灯笼 长春市图书馆“闹春图”元宵节系列活动来了 重庆返岗复工农民工达260余万人 返岗率逾六成 美国新冠肺炎死亡人数超50万 超一战二战和越战美阵亡者总和 第五届联合国环境大会召开 中方呼吁采取全球行动应对环境问题 机场“逐鸟人”:黑脸蛋是我们的“标配” 吉林省人社厅发布通知,2021年社会保险缴费有新变化! 伊朗最高领袖:如有需要或将浓缩铀丰度提高至60% 国资委:支持央企加快国有资本的布局优化和结构调整 亚泰广州冬训先“瘦身”再“增肌” 内外援引进工作将全面展开 零距离!揭开天问一号火星环绕器神秘面纱 洮南:强化政务大厅疫情防控 确保群众办事安全 谭德塞:全球各地都进行新冠疫苗接种符合所有国家的利益 智利累计新冠确诊病例超80万例 外企看中国丨专访IBM大中华区首席执行官:我们期待在中国“云”端舞出新姿 嫦娥五号带回月壤 3月将在国家博物馆展出 牛年元宵节 十六月最圆 利益联结产业链上游,伊利全面助力东北地区乡村振兴 春节假期后文旅新风尚 开春如何玩得更尽兴? 长春新区:打造“升级版”营商环境 省运管局指导各地全面有序恢复道路旅客运输服务 游客捞取泉池内硬币引发争议 趵突泉景区回应 一派生机盎然!湖北武汉:开启“全城赏花”模式 澳大利亚学者认为比特币价值被高估 北京汤圆元宵抽检全合格 温馨提示:带冰霜的别买 刚果(金)总统谴责联合国车队遇袭事件 湖南两名男子爆竹炸6条小鱼被取保候审 同时段播放全国第一,实时收视率破1!电视剧《鲜花盛开的山村》,不一样的乡村戏! 挂着名校牌子,收费高,却很孬!有名无实的“冠名办校”值得警惕 联合国人权理事会第46届会议昨日开幕 中方代表发表视频致辞 注意!吉林省这5批次食品不合格! 非洲新冠确诊超383万例 多国持续推进疫苗接种 吉林省退役军人事务厅发布“清明•致敬英雄”主题征文、摄影征集评选活动的公告 @吉林人,坚持完今天,24日气温将回升了! 推动两国关系重回正轨 女童海洋公园爬凳摔伤 脸缝4针 家长要求园方赔偿合理吗? 为中国疫苗投下信任票 多国领导人“带头”接种 海外网评:50万条逝去的生命,美国无法治愈之痛
您的位置:首页 >财经 >

浙江大学-同盾科技AI联合实验室发表论文被AAAI 2020收录

2020-04-09 18:55:12来源:金融界网站

  金融界网站讯 近日,浙江大学-同盾科技人工智能联合实验室发表的论文《Rethinking the Bottom-Up Framework for Query-based Video Localization》被人工智能顶级会议AAAI 2020收录,在现场被评选为口头报告论文(oral presentation), 值得一提的是整个大会口头报告论文接受率仅为5.9%。

  论文提出Bottom-Up视频定位算法创新,表现超越了Top-Down SOTA(State-of-the-Art,目前最优)模型算法,在解决视频片段的检索任务,改良当下自底向上模型的设计缺陷上,取得新突破。创新成果未来对于视频内容检索,内容审核与合规风控管理体系的建设具有重要的应用价值。

  自“浙江大学-同盾科技人工智能联合实验室”成立以来,双方在学术研究领域不断取得重要成果。联合实验室于2018年正式挂牌成立,并由浙江大学计算机学院教授庄越挺,同盾科技创始人、CEO蒋韬担任联席主任。

  联合实验室研究课题面向人工智能基础技术,包括金融领域应用的联邦学习算法研究、风控环境领域的自然语言处理、复杂网络的异常检测方法,视觉内容理解与推理算法研究等方向。旨在智能分析决策领域取得基础理论和核心技术的突破,并与金融、互联网、交通、政府及公共事务等领域相结合,推动产业智能化升级。

1

  本次收录在AAAI 2020的论文是联合实验室一系列重要成果的缩影,该论文通过分析目前视频片段检索框架(自顶向下模型和稀疏型自底向上模 型)的优缺点,提出一种全新密集型自底向上的框架,可以避免现有框架的所有缺点。同时,研究团队设计了一个基于图卷积的特征金字塔层,来增强骨干网络的编码能力。

  以下为论文节选精华:

  在基于查询的视频定位任务中,重新评估了以往表现不尽如人意的Bottom-Up网络框架的潜力。文章通过重新设计框架的backbone和head network,提出了Graph-FPN with Dense Predictions (GDP)模型,在两类基于查询的视频定位任务上超越了Top-Down SOTA模型。

  视频定位算法框架现状

  现有的视频定位算法可以被归类为两大类:Top-Down以及Bottom-Up。Top-Down方法将整段视频预切割成一系列候选短视频,接着对每一段候选视频进行分类和回归;Bottom-up方法将query和整段视频作为输入,输出每一帧作为“开始/结束”标记的概率分布。

  尽管当前Top-Down方法在表现上比Bottom-Up方法要更加优秀,但是Top-Down模型有一些非常糟糕的限制条件需要注意:首先模型表现对例如temporal scale或者candidate number的启发式规则很敏感;其次为了提高模型的召回率,通常我们需要非常密集地选择候选短视频,这就导致了Top-Down方法需要大量的计算从而导致较慢的定位速度。

  Bottom-Up方法就是为了解决这些问题而提出的,一个标准的Bottom-Up方法(如下图)由两部分构成:分别为backbone和head network。前者通常采用co-attention或者cross-gating机制将query的语义和视频的每一帧关联起来;backbone的输出(query-ref frame sequence)经过LSTM/RNN编码之后将会进入head network,该网络预测每一帧视频作为“开始/结束”标签的概率。

1

  图 1 标准Bottom-Up架构

  作者认为,当前的Bottom-Up方法表现不及Top-Down方法的原因在于两部分网络设计的缺陷。

  关于backbone:

  -backbone仅仅使用RNN/LSTM对视频帧(frame)之间的相互关系进行建模,而忽略了场景(scene, a cluster of frames)之间的相互关系;

  -backbone中采用的大多是低维特征向量,而Bottom-Up框架需要更加高维的语义信息来进行视频定位。

  关于head network:

  -对每一帧视频进行“开始/结束”标记的分类,现有数据的ground truth是一个极度不平衡的数据集;

  -对于开始帧和结束帧的标注在已知方法中是独立的,这显然导致模型忽略了截取视频内容的一致性。

  全新Bottom-Up模型Graph-FPN with Dense Predictions(GDP)

  本文提出的模型GDP在两个部分都进行了改进,下图为GDP的详细图解。

2

  图 2 GDP模型细节

  在backbone中,GDP引入了Graph-FPN层来增强backbone的表达能力。该层首先对于query-ref frame sequence构造一个金字塔状的层次化结构来更好地捕捉高维语义信息;接着将这些多规模的帧映射到场景空间(scene space),其中一个节点代表了一个场景;最后在这个场景空间进行图卷积,从而对场景间的相互关系进行有效的建模。

  在head network中,GDP将原先的稀疏分布预测替换成了稠密的预测:它将所有在“开始/结束”标记的之间的视频帧认为是正样本(foreground),其余的认为是负样本(background)。同时,每一帧都会对自己作为边界(boundary)的自信度进行打分。这样一来就解决了之前提到的Bottom-Up模型的样本分布不均匀的问题。

  多个测试集表现超越SOTA

  本文工作在两大类任务,自然语言视频定位(Natural Language Video Localization)以及视频重定位(Video Relocalizaiton )的多个数据集(TACoS, Charades-STA, ActivityNet Captions, and Activity- VRL )上进行测试,表现均优于SOTA模型,以下是具体的表现。

3

  表 1自然语言视频定位任务:GDP模型在3个数据集的9个指标中获得8个最佳

4

  表 2 视频重定位任务:GDP模型在6个指标中均为最佳

  再来看看head network是否稀疏的消融实验结果(见表3),在多个任务的多个数据集中,使用了Dense head network的模型普遍有更为优秀的表现。

5

  表 3 和稀疏head network模型的比较

  最后我们来看一下使用GDP模型的效果,我们可以看到GDP对于该帧是否被ground truth包含的分类score总是倾向于在这一段ground truth正中间,是一个比较好的表现。

6

  图 3 实验结果展示

  来源为金融界财经频道的作品,均为版权作品,未经书面授权禁止任何媒体转载,否则视为侵权!

免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。涉及到版权或其他问题,请及时联系我们。

猜你喜欢