讲习班背景
人工智能前沿讲习班为促进人工智能领域的青年从业者更好地了解本领域学科前沿,加强学术交流,开阔视野以及提高技术水平而设立的学术性活动。讲习班将邀请相关领域的一流专家、资深科研人员、企业精英,围绕该领域的热点前沿问题,分阶段、分专题地集中性地展开高、精、深的讲解。并藉此活动的举办,实现人工智能领域产、学、研一体的良性发展。
开班主题:
《深度学习如何推动AI发展》
纵观国内外科技资讯,图像分类、人脸识别、机器翻译、无人驾驶、机器人、虚拟个人助手、语音识别、个性化内容推荐……人工智能领域百花齐放,人类社会正在从“互联网+”向更高阶的“人工智能+”发展。本次讲习班为《人工智能前沿讲习班》首期开班,开班主题为:《深度学习如何推动AI发展》。首期讲习班邀请了人工智能几个重要分支的著名学者和业界专家做报告。他们将对这些重要分支的前沿发展进行介绍,并介绍深度学习如何促进本领域的发展。
日程安排
2016年12月16-18日 北京 中科院自动化所
特邀嘉宾
谭铁牛
中国科学院副院长,中国科学院院士,英国皇家工程院外籍院士,发展中国家科学院(TWAS)院士,巴西科学院通信院士,国际电子电气工程师学会(IEEE)和国际模式识别学会Fellow,中国人工智能学会副理事长,中国图像图形学会理事长。

开班致辞
特邀讲者
白翔
华中科技大学电子信息与通信学院教授,博士生导师,国家防伪工程中心副主任。先后于华中科技大学获得学士、硕士、博士学位。他的主要研究领域为计算机视觉与模式识别、深度学习。尤其在形状的匹配与检索、相似性度量与融合、场景OCR取得了一系列重要研究成果,入选2014、2015年中国高被引学者。他的研究工作曾获微软学者,国家自然科学基金优秀青年基金的资助。他已在相关领域一流国际期刊和会议如PAMI、IJCV、CVPR、ICCV、ECCV、NIPS、ICML上发表论文30余篇,担任国际期刊Frontier of Computer Science, Pattern Recognition Letters, Neurocomputing, Pattern Recognition等编委或客座编辑。

报告题目: 看图识字:基于合成数据的场景文本深度表示方法
摘要:近年来,场景文字识别 (Photo OCR)成为模式识别及相关领域中的一个热点问题,在图像理解,商品搜索,无人驾驶定位及导航,人机交互及虚拟现实等有着重要的应用价值。本次报告中,首先会介绍近年来深度学习研究在此领域的研究现状;然后,我将介绍本研究团队在此领域的近期研究成果:基于深度神经网络的场景文本自动矫正方法(CVPR'16);基于全卷积网络的多方向场景文本检测方法(CVPR'16);基于合成数据的场景文本端到端识别及检索算法框架(AAAI'17);融合场景与文本的细粒度图像识别神经网络。最后,对此方向的未来研究趋势和应用前景作出展望。

陈玉荣
博士,英特尔中国研究院认知计算实验室研究总监,负责领导面向英特尔未来智能计算平台的视觉认知(视觉分析和理解)和机器学习研究工作。带领团队研发基于深度学习的视觉识别以及领先人脸分析技术来影响英特尔架构,并为英特尔实感技术,客户端应用和物联网端对端视频解决方案提供关键技术(人脸物体检测识别、人脸关键点检测跟踪,表情识别等)。带领团队在ACM ICMI举办的自然环境下的情感识别挑战赛(EmotiW2015)的音-视频识别任务中获得第一名。并由于在先进视觉分析和多模态情感识别方面取得卓越研究成就,他的团队连续获得了英特尔研究院2014和2015年度全球最高学术奖-戈迪奖(以英特尔公司创始人戈登·摩尔命名)。他于2004年中科院软件所博士后出站加入英特尔,2002年毕业于清华大学获博士学位。在国际学术会议和期刊上发表学术论文近40篇,拥有10余项美国/国际专利。

报告题目: 面向视觉理解的高效深度学习算法设计
摘要:深度卷积神经网络已经成为几乎所有视觉识别和检测任务的主流算法,并在一些具体任务上接近(或超越)人类的表现。然而,许多主流的深度网络都包含千万级甚至是过亿的学习参数,计算复杂性和内存需求都比较高,使得它们难以部署在具有有限硬件资源和功耗限制的客户端或嵌入式系统上。解决这个问题的关键是高效的深度学习算法设计,以便更好地平衡精度,速度,内存消耗和功耗。本次演讲将围绕高效深度学习算法设计,深度网络模型压缩与修剪展开,介绍我们基于深度学习的视觉理解相关工作,包括情感识别HoloNet,物体检测 HyperNet和模型压缩Dynamic Network Surgery等。

乔宇
Yu Qiao is a professor with the Shenzhen Institutes of Advanced Technology (SIAT), the Chinese Academy of Science, and the deputy director of multimedia research lab. He has been a JSPS fellow and then a project assistant professor with the University of Tokyo from 2007 to 2010. His research interests include computer vision, speech processing, pattern recognition, and deep learning. He has published more than 110 papers in these fields. He received the Lu Jiaxi young researcher award from the Chinese Academy of Science.

报告题目: 面向复杂行为理解的深度学习模型及应用
摘要:基于视频的行为分析和识别是计算机视觉的一个基本问题,在监控、人机交互、视频检索等领域有重要的应用。与图像相比,行为视频包含有丰富的运动信息数据维度也更高。同时由于视频中包含行为人、视角、背景、运动、遮挡等复杂的变化,非受控条件下行为识别一直是一个极具挑战的问题。在这个报告中,我们将介绍视频行为分析与理解的最新进展,特别是我们课题组近年来开展的一些工作(CVPR13, ICCV13, CVPR 14, ECCV 14, CVPR15, IJCV 15, CVPR16,ECCV16)。内容包括视频中层表示、多视角特征编码、轨迹卷积特征池化、运动向量CNN、时空注意模型等。我们的方法在公开多类别数据库UCF101, HMDB51上取得了领先的识别率,在ActivityNet, ChLearn等国际竞赛中取得第一。

山世光
中国科学院计算所研究员。主要从事图像处理与理解、计算机视觉、模式识别、智能人机交互界面等研究。在包括IEEE Trans. on PAMI, IEEE Trans. on Image Processing以及CVPR, ICCV, ECCV等国内外学术期刊和会议上发表论文100余篇。与博士生合作完成的有关流形到流形距离的论文获CVPR2008 Best Student Poster Award Runner-up奖。现任国际学术刊物Neurocomputing的编委(AE),长期担任十多个重要国际期刊以及国内主要一级学报(计算机领域)的审稿人。

报告题目: 从人脸识别看深度学习对计算机视觉的推动及挑战
摘要:讲座将首先介绍人脸检测与识别领域近年来如何从传统方法迅速切入了大数据驱动的深度学习方法,并介绍深度学习特别是卷积神经网络技术的基本原理、演进及其面临的挑战,以及深度化后的人脸感知技术的进展情况及其应用现状。以此为基础,总结和反思深度学习给人脸识别乃至整个计算机视觉领域带来的深刻变革,并讨论知识驱动与数据驱动两个研究范式之间的差别与融合可能。报告也将介绍我们发布的SeetaFace人脸识别引擎的技术原理和水平。最后对相关领域仍然面临的挑战进行总结和讨论。

陶建华
中科院自动化所模式识别国家重点实验室副主任、研究员、博士生导师、国家杰出青年基金获得者。先后负责和参与国家级项目(863计划、国家自然科学基金、国际合作)40余项,在包括IEEE Transaction on ASLP、ICASSP、ICSLP、ICCV等国内外学术期刊和会议上发表论文150余篇,论文和成果曾获全国人机语音通讯学术会议优秀论文一等奖、全国信号处理学术会议优秀论文奖、北京市科技进步二等奖等。

报告题目: 深度学习与语音

王亮
中国科学院自动化研究所研究员,主要从事基于步态的身份识别、人的运动和行为分析、大规模的聚类算法研究及数据挖掘等。已在主要的国际期刊和学术会议上发表论文70多篇,其中SCI检索的国际期刊论文20篇,并已被广泛引用(如Google Scholar引用约2000次,SCI他引约350次)。担任程序委员会成员、期刊编委会成员或审稿人,当前是5个国际期刊的编委,4个国际期刊专刊的客座编委,5本编著以及多个国际学术研讨会的程序主席等。

报告题目: 视觉计算与深度学习

王井东
I am a Lead Researcher at the Internet Media Group, Microsoft Research Asia. I received the B.Eng. and M.Eng. degrees in Automation from the Department of Automation, Tsinghua University, Beijing, China, in 2001 and 2004, respectively, and the PhD degree in Computer Science from the Department of Computer Science and Engineering, the Hong Kong University of Science and Technology, Hong Kong, in 2007. My areas of interest include machine learning, pattern recognition, multimedia computing, and computer vision. In particular, I have worked on kernel methods, semi-supervised learning, data clustering, image segmentation, and image and video presentation, management and search, and Big Media. At present, I am mainly working on deep learning, large-scale indexing, human understanding, and person re-identification.

报告题目: The power of deep fusion

吴甘沙
驭势科技有限公司CEO,原英特尔中国研究院院长,是英特尔中国研究院的第一位“首席工程师”。在英特尔工作期间,他发表10余篇学术论文,有22项美国专利,14项专利进入审核期。2016年1月底,离职创业。担任驭势科技CEO。

报告题目: 深度学习与智能驾驶

赵军
中国科学院自动化研究所研究员,博士生导师。主持国家自然科学基金、863计划、中国出版集团科技项目等项目。研究方向为信息检索、信息提取、网络挖掘、问答系统等。在IEEE TKDE、JMLR等顶级国际期刊和ACL、SIGIR、CIKM、AAAI、IJCAI、EMNLP、COLING等顶级国际会议上发表论文六十余篇,获COLING-2014最佳论文奖,获KDD-CUP2011亚军(2/1297)。研发了汉语文本分析、信息抽取和知识工程、百科问答等软件工具和平台,在中国大百科全书出版社、华为公司、讯飞公司等得到应用。

报告题目:深度学习与自然语言理解 (拟)
分享