报告题目:面向跨媒体推理的视频问答方法
报告人:韩亚洪
时间:2018年5月9日上午10:00
地 点:电信学院大会议室
摘要:
作为人工智能、多媒体和计算机视觉领域的热点问题,视觉问答(Visual QA)在近期引起了广泛关注。视频数据由于增加了时间维度而更加复杂,如何对视频中的复杂时序关联进行建模并发现事件线索、以及如何利用多源异构上下文信息进行跨媒体问答推理等成为难点问题。本报告首先介绍面向“从图像/视频-到-语言”的视觉内容语义描述自动生成的相关研究,并在此基础上介绍基于层叠记忆网络(Layered Memory Networks)视频问答方法。
个人简介:
韩亚洪,天津大学计算机学院教授、博士生导师,研究方向为多媒体分析、计算机视觉和机器学习。2012年3月博士毕业于浙江大学计算机学院,博士毕业被天津大学直接聘为副教授,2016年在天津大学破格晋升正教授。是CCF优秀博士学位论文奖获得者(2012年度)、教育部新世纪优秀人才支持计划入选者(2013年度)。在国家留学基金委资助下,于2014年11月至2015年11月在美国科学院院士、美国加州大学伯克利分校统计系郁彬(Bin Yu)教授课题组做访问学者。