此次讲座面向17级计算机、软件全日制专硕
中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum
CCF YOCSEF天津
于2017年12月17日(星期日)9:30-16:00
在澳门新葡平台网址8883入口津南校区综合业务西楼报告厅举行
欢迎参加
报告会主题
人工智能青年科学家论坛:媒体计算新进展
视觉是人类获取信息的主要渠道。图像、视频、几何模型等可视媒体信息在经济、军事、教育等领域发挥着越来越重要的作用,已经成为同能源与材料同等重要的战略资源。然而,可视信息本身存在着数据量大、无结构化等特点,使得分析较为困难。对可视信息进行有效的表达及加工,并从中提取有用的知识是目前计算机视觉和计算机图形学的研究重点。本次报告会围绕人工智能主题,围绕媒体计算相关的前沿问题展开讨论。
程 序
09:00-09:30 签到
09:30-09:40 致辞
09:40-10:15 特邀讲者:韩军伟 西北工业大学
报告题目:脑神经媒体组学
10:15-10:50 特邀讲者:李玺 浙江大学
报告题目:人工智能驱动的视觉特征计算、学习及其应用
10:50-11:25 特邀讲者:郑伟诗 中山大学
报告题目:非对称行人重识别
11:25-12:00 特邀讲者:鲁继文 清华大学
报告题目:深度学习与视觉理解
12:00-13:30 午休
13:30-14:05 特邀讲者:左旺孟 哈尔滨工业大学
报告题目:基于判别学习的图像复原
14:05-14:40 特邀讲者:孟德宇 西安交通大学
报告题目:误差建模原理
14:40-15:15 特邀讲者:胡清华 天津大学
报告题目:大规模分类任务的分层学习
15:15-16:00 Panel专题讨论
16:00 会议结束
执行主席:程明明 澳门新葡平台网址8883入口 CCF YOCSEF天津副主席(13212106983)
执行主席:杨巨峰 澳门新葡平台网址8883入口 CCF YOCSEF天津AC委员(18622233366)
参会者:IT领域专业人士、学生、媒体、其他有兴趣者等
讲者介绍
特邀讲者:韩军伟
西北工业大学教授,自动化学院副院长,信息融合技术教育部重点实验室副主任,国家优秀青年科学基金获得者,欧盟玛丽居里学者,陕西省重点科技创新团队负责人。主要研究方向是多媒体信息处理和脑成像分析。已在领域顶级期刊如:Proceedings of the IEEE,IEEE TPAMI, IJCV, NeuroImage, Cerebral Cortex等发表学术论文60余篇,在领域顶级的国际会议如:CVPR,ICCV,MICCAI,IPMI, IJCAI等发表学术论文30余篇。ESI高被引论文12篇,ESI热点论文5篇。获得国际会议ACM Multimedia 2010,MICCAI 2011和ICME 2016最佳学生论文奖提名。获得教育部自然科学二等奖(排名第一)等省部级科技奖励3项。担任IEEE Trans. on Human-Machine Systems, Neurocomputing等10余个国际期刊编委/客座编委。
报告题目:脑神经媒体组学
报告摘要:人脑是图像/视频内容的最终判定者,随着脑科学技术的飞速发展,可以利用非侵入的磁共振功能成像手段获取大脑在观看多媒体时的反应,这种反应包含大脑的语义层理解信息。“脑神经媒体组学”是一个新的研究方向,利用机器学习理论为手段,实现大脑反应信息对多媒体视听觉特征的指导、优化和融合,达到计算机对于多媒体内容实现接近人脑认知的目的。同时,此研究也探索大脑在多媒体刺激下的工作机制。本报告将汇报“脑神经媒体组学”研究中的一些关键技术及最新进展。
特邀讲者:李玺
浙江大学教授,博导,现就职浙江大学计算机学院人工智能研究所,入选浙江省151第二层次人才。主要从事计算机视觉、模式识别和机器学习等领域的研究和开发。在目标跟踪、目标行为识别、图像标注、视频检索、哈希(hashing)函数学习、深度特征学习等方面取得了深入系统的研究成果,其中在视频的运动跟踪、理解与检索等方面的研究具有特色和优势,取得了多项具有国际影响力的创新性成果。本人在国际权威期刊和国际顶级学术会议发表文章100多篇。担任神经计算领域知名国际刊物Neurocomputing和Neural Processing Letters的Associate Editor,同时担任多个计算机视觉和模式识别方面的国际刊物和国际会议的审稿人和程序委员。获得两项最佳国际会议论文奖(包括ACCV 2010和DICTA 2012),ICIP2015 Top 10% paper award,另外分别获得两项中国北京市自然科学技术奖(包括一等奖和二等奖),以及一项中国专利优秀奖。
报告题目:人工智能驱动的视觉特征计算、学习及其应用
报告摘要:互联网和物联网时代催生了海量视频大数据,从这些海量视频数据中有效提取知识迫切需要各种人工智能的技术和手段。因此,如何进行人工智能驱动的视觉计算已经成为当今知识经济时代亟待解决的核心技术问题。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉特征学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模视觉特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了视觉特征表达和学习领域的不同发展阶段,介绍了近年来我们利用视觉特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。报告的最后将和大家一起探讨一下涉及视觉特征学习所面临的一些开放性问题和难题。
特邀讲者:郑伟诗
中山大学数据科学与计算机学院教授。他主要面向大规模智能视频监控,展开视频图像信息与信号的处理研究,并开展大规模机器学习的算法和理论研究。他目前的主要研究应用领域是:视频监控下的行人身份识别与行为信息理解。面向大规模监控网络下的行人追踪问题,他在国内外较早和持续开展跨视域行人重识别的研究,发表一系列以跨视域度量学习为主线的研究工作,他提出的基于相对比较思想建模思路在行人重识别中被广泛深入研究。他已发表100余篇主要学术论文,其中60余篇发表在图像识别和模式分类IEEE TPAMI、IEEE TIP、IEEE TNN、PR、IEEE TCSVT、IEEE TSMC-B等国际主流权威期刊和ICCV、CVPR、IJCAI等计算机学会推荐A类国际学术会议。获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金、广东省自然科学杰出青年基金和广东省创新领军人才项目支持。主页:http://isee.sysu.edu.cn/~zhwshi/
报告题目:非对称行人重识别
报告摘要:为了实现大范围多摄像机网络下的行人连续追踪,行人重识别在过去多年得到了大力发展。但是,行人重识别不同于人脸识别或一般的搜索问题,有自身的特殊性和独有的挑战。这次报告将分享我们对行人重识别的理解,尤其汇报我们如何发展一种非对称的建模思路和理论算法来解决行人重识别的特有挑战。
特邀讲者:鲁继文
清华大学自动化系副教授,博士生导师,主要研究方向为计算机视觉、模式识别和机器学习,具体研究内容包括深度学习、度量学习、人脸识别和视频分析。发表IEEE汇刊论文51篇(其中PAMI论文8篇),ICCV/CVPR/ECCV/NIPS论文27篇,ESI高被引论文和热点论文6篇,SCI他引1200余次,Google Scholar引用4200余次。担任IEEE信号处理学会多媒体信号处理技术委员会委员,IEEE信号处理学会信息取证与安全技术委员会委员,IEEE电路与系统学会多媒体系统与应用技术委员会委员,Pattern Recognition等5个国际期刊编委。
报告题目:深度学习与视觉理解
报告摘要:报告将介绍课题组近年来所提出的面向视觉内容理解的深度学习系列方法,主要包括深度度量学习、深度哈希学习、深度共享学习、多模态深度学习和深度强化学习等,以及它们在人脸和属性识别、行人跟踪与识别、跨模态匹配与识别、图像和视频检索等多个视觉理解任务中的应用。
特邀讲者:左旺孟
哈尔滨工业大学计算机学院教授、博士生导师。主要从事图像编辑、增强与复原,物体检测与目标跟踪,图像与视频分类等方面的研究。在CVPR/ICCV/ECCV等顶级会议和T-PAMI, IJCV及IEEE Trans.等期刊上发表论文60余篇。
报告题目:基于判别学习的图像复原
报告摘要:通常的图像增强与复原方法多采用建模的思路,然而这些方法往往受限于形式而难以对像素间的高度非线性和长程依赖关系进行建模。考虑到各种任务的差异性,以及丰富的训练数据,以深度学习为代表的判别学习方法为提高图像复原性能提供了新的解决思路,近年来得到了较多的关注和发展。报告主要从发展特定判别学习方法和借鉴CNN模型两个角度,介绍我们近期在这方面的一些工作:(1) 针对图像盲去卷积问题,结合多尺度模型,采用了基于数据驱动的方式学习每次迭代的先验模型参数和正则化参数。(2) 针对图像去噪问题,通过分析残差学习与TNRD模型的关联关系,提出了一个面向图像去噪的卷积神经网络,并分析了模型在广义去噪问题中的潜力。(3)为将CNN更为便捷和自适应地应用于各种图像复原问题,提出了一种传统优化方法和CNN的结合方案。(4) 最后,针对图像去噪和超分辨,通过将退化模型参数纳入到网络输入,提出了一种更为高效的CNN解决方案。
特邀讲者:孟德宇
西安交通大学教授、博士生导师。目前主要聚焦于自步学习、误差建模、张量稀疏性等机器学习相关方向的研究,共接收/发表IEEE汇刊论文20篇,CCF A类会议论文30篇。曾担任ICML,NIPS等会议程序委员会委员,AAAI2016,IJCAI2017高级程序委员会委员。
报告题目:误差建模原理
报告摘要:传统机器学习主要关注于确定性信息的建模,而在复杂场景下,机器学习方法容易出现对数据噪音的鲁棒性问题,而该鲁棒性问题与误差函数的选择紧密相关。本次报告聚焦于如何针对包含复杂噪音数据进行误差建模的鲁棒机器学习原理。这一原理已经在遥感影像、CT图像与高光谱图像的相关应用中取得良好效果,并有望引导出更多有趣的机器学习相关应用与发现。
特邀讲者:胡清华
教授、博导、副院长。哈工大博士,2012年进入天津大学任教。目前是天津大学计算机学院的副院长,机器学习与数据挖掘实验室负责人、中国人工智能学会粗糙集与软计算专委会副主任。主要从事多模态学习和不确定性建模方面的研究,并致力于将基础研究成果应用于大型设备健康管理和故障诊断,在燃气轮机状态监测、异常数据检测、故障模式提取和趋势预测方面开展了深入的研究。先后获国家自然基金重点项目,优青项目、973项目的资助。获2016年度黑龙江省高校自然科学一等奖和黑龙江省自然科学一等奖。在IEEE TKDE、IEEE TFS、IEEE TCYB、IEEE TNNLS等期刊和IJCAI、AAAI、ICCV、CVPR 等国际顶级会议上发表学术论文150 余篇,出版专著3部。
报告题目:大规模分类任务的分层学习
报告摘要:分层分类是一种利用数据类别间层次结构关系进行分类的任务,可以高效地组织和处理大规模数据。近些年来,在这个受到越来越多关注的领域中涌现出许多重要的工作。本文介绍分层分类的定义,并按照不同种类的问题解决策略,对大规模分层分类任务中的几个基本问题的研究进行总结。首先,给出层次结构的形式化定义。其次,分别阐述如何设计分层评价指标、如何构建层次结构、如何利用层次结构信息进行特征选择、如何利用层次结构信息训练分类器以及如何面向层次结构设计停止机制,并介绍具有代表性的相关工作。最后,对大规模分层分类任务进行总结,并展望未来可能的研究方向。