讲习班背景
“人工智能前沿讲习班”由中国人工智能学会主办,旨在短时间内集中学习某一领域的基础理论、最新进展和落地方向,并促进产·学·研相关从业人员的互相交流的一个平台。对于硕士、博士、青年教师、企事业单位相关从业者、预期转行AI领域的爱好者均具有重要的意义。”
第三期主题:
《大数据:从理论到应用》
AIDL系列活动已经成功举办两期,本次主题为《大数据:从理论到应用》由中科院计算所副所长程学旗研究员任学术主任,将于5月12至14日在深圳·深圳大学举办。本次活动四大亮点如下:
1. 主题集中
根据研究报告显示, 62% 的大中型公司希望在未来的两年内能将机器学习用于商业分析。大中型公司认为大数据分析是必须的,并且接受基于大数据分析的新技术。“大数据”可谓火爆了所有企业圈,到底何为大数据?如何应用大数据分析技术来提高企业的核心竞争力?如何利用大数据进行转型?大数据技术的最新进展如何?本次活动将集中回答关于大数据所有你想知道的内容。

2. 内容前沿
本次所有的报告内容,均是大数据领域专家的最新研究进展成果。对于掌握技术发展趋势,把握未来发展方向有重要的指导意义。

3. 兼具理论和实践
本次活动兼具大数据理论基础的讲解和大数据技术的典型应用,不仅对从事科研的工作者有重要的启发,也将指引企业利用大数据进行升级转型。

4. 阵容强大
AIDL3邀请到了中科院计算所副所长程学旗研究员作为学术主任,一众海内外研究机构和企业的一线专家坐镇现场授课,与顶级大牛进行学术、技术交流和思想碰撞。
日程安排
学术负责人
程学旗:中国科学院计算技术研究所研究员、副所长、副总工程师,中国科学院网络数据科学与技术重点实验室主任,大数据分析系统国家工程实验室副主任,国家杰出青年科学基金、国务院特殊津贴获得者,中国计算机学会大数据专家委员会秘书长,中文信息学会常务理事、信息检索专委会常务副主任,中文信息学会社会媒体处理专业委员会副主任。担任国际学术会议ACM WSDM 2015的大会主席、IEEE Big Data Conference 指导委员会共同主席,持续担任ACM SIGIR、ACL、WWW、IJCAI、IEEE ICDM、ACM CIKM、ACM WSDM等著名国际学术会议程序委员会资深委员、委员或分会主席。 主要研究方向大数据科学、社会计算、Web信息检索与数据挖掘。近年来,先后主持并完成了十余项国家自然科学基金、国家重点基础研究发展计划(“973”计划)、国家高技术研究发展计划(“863”计划)、国家信息安全重大专项以及中国科学院知识创新工程等科研任务。担任973计划“网络大数据计算的基础理论及其应用研究”、国家863目标导向课题“大规模网络内容安全控制关键技术与示范系统研究”课题负责人。研究成果应用于大规模网络信息监测、网络数据分析与服务等领域,两次获得国家科技进步奖二等奖(2012 年个人排名第一、2004年个人排名第二),获得第十二届中国青年科技奖、中国计算机学会青年科学家奖、中国科学院青年科学家奖等荣誉。

特邀讲者
操龙兵:非独立同分布学习(Non-IID Learning)
摘要:经典的学习与分析系统主要是基于独立同分布(IID)假设建立起来的,即认为对象与特征是独立同分布的。实际数据与问题基本上是非独立同分布的(non-IID),尽管目前还没有合适的理论与系统来衡量数据与问题的非独立同分布性(non-IIDness)。本报告介绍基于独立同分布学习可能带来的问题(如分析结果不准确或者错误)、非独立同分布学习的基本概念与学习框架、目前的相关进展、并示例非独立同分布学习的相关理论与方法,以及在数据科学与分析学中的广泛机遇。
个人简介:
操龙兵教授很早就在国际上致力于数据科学与分析学的产、学、研工作。他注重从涉及重大民生与经济、社会问题中提炼具有前瞻性的研究课题;采取学科交叉、理论与实践、产学研相结合的方法,提出一系列新的研究问题与创新学术思想,包括行为信息学(Behavior Informatics)、非独立同分布学习(Non-IID Learning)、决策知识发现(Actionable Knowledge Discovery)。他在上述方向发表专著3部、论文300余篇。
他在2007年成立澳洲第一个``数据科学与知识发现实验室’’;2011创立世界上第一个分析学(Analytics)研究硕士学位与博士学位;2011所创立的先进分析研究所是澳洲政府发布的关于大数据策略与更好的大数据实践等白皮书中唯一一个被特别介绍的机构;2013年建立IEEE数据科学与先进分析学任务组,IEEE行为、经济、社会与文化计算任务组,IEEE教育数据挖掘任务组;2014年成立IEEE International Conference on Data Science and Advanced Analytics(DSAA)大会;2015年在Springer设立International Journal of Data Science and Analytics。他是KDD2015等多个大会主席或程序委员会主席,以及澳洲大数据峰会发起人。
在大数据分析领域,他与诸多政府、大型企业、国际知名运营商等的合作支持,在澳大利亚和中国等直接领导与实施多个大型研究与工业项目,涉及金融与资本市场监管与投资,金融危机与跨市场研究,财政、社保、医保、税务、统计、审计等政府业务风控,电商与零售分析,反洗钱、网银与支票风控,寿险与车险风控,航空常旅客管理,电信经营分析决策,教育与学习行为分析与管理,以及出版等多个行业。他2011为国内某市制定了数据产业规划。他所领导的大数据分析项目已为相关政府与企业创作几十亿澳元的直接经济效益、在相关媒体、政府与经合组织报道。

柳崎峰:人工智能和大数据用于金融科技创新和实践
摘要:FDT一直在探索如何将用人工智能和大数据技术,在交易员和全球各种金融市场行情具有高度不确定的情况下,刻画日内与日间交易员的行为金融特性,对金融交易和长期投资的随机时间序列进行最优化和个性化。除了介绍方法和原理以外,我将会介绍我们的成功应用的产品,例如用于选拔顶尖交易员的FDTScore、用于资产组合优化和风险控制的FDT智能投顾云、用于对冲交易基金优化的资源个性化分配、用于日内交易的智能市场波动预测等。
个人简介:
我目前工作于香港智能投顾技术有限公司(FDT-RA),担任FDT-RA首席执行官 & FDT首席数据科学家,重点从事智能金融科技领域,包括:选拔和训练职业交易员、智能投顾和财富管理、金融风险管理、交易资源优化等。我在中科院自动化研究所获取博士学位,专业是模式识别与智能系统。之后在Yahoo! Lab、Samsung Lab和芯片SoC等公司工作12+年。我在IEEE/ACM等国际会议和杂志上发表了20+篇论文,获得了国内外20+专利,研发领域包括:智能金融科技、人工智能、大数据、搜索引擎和推荐系统、计算机视觉、SoC图像芯片设计等几个方面。


邹磊:基于图的RDF知识图谱数据管理
摘要:RDF用W3C提出是对于语义网中的Web对象建模的数据模型。目前,已经涌现出大量的RDF知识库,比较著名的有DBPedia,Yago,Yago2和Freebase等。同时,很多IT公司也在致力于大规模RDF知识库的构建,例如Google的知识库图谱,微软的Satori,搜狗公司的知立方,以及百度的实体搜索。大规模RDF知识库为目前的数据管理领域带来了新的挑战和机遇,例如如何有效地存储和检索这些大规模的RDF知识库数据。在本次的报告中,我首先回顾一些经典的按照关系数据库的方法来管理RDF数据的技术。然后,我集中讨论从图数据库的观点来研究RDF数据管理的问题。具体的,我将讨论如何利用图数据库中的子图匹配技术来处理RDF知识库中的查询问题。我讨论两种查询,SPARQL和自然语言查询,以及如何利用子图匹配来有效地回答这两类查询。最后,我将演示我们的基于图的RDF数据管理Demo系统,gStore和gAnswer;前者是用来设计支持SPARQL 1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统
个人简介:
邹磊,北京大学计算机科学技术研究所副教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统。邹磊已经发表了30余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近20余篇;其论文被引用超过1200多次(根据Google Scholar的统计),单篇最高被引用298余次。邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一)。

熊辉:Talent Analytics: Prospects and Opportunities
摘要:The big data trend has made its way to talent management. Indeed, the availability of large-scale human resources (HR) data provide unparalleled opportunities for business leaders to understand talent behaviors and generate useful talent knowledge, which in turn deliver intelligence for real-time decision making and effective people management at work. In this talk, I will introduce the state-of-the-art techniques used to evaluate the management performance, recruit and retain great people, enhance talent development, and demonstrate how these techniques are used at cutting-edge companies. In particular, I will explain how data analytic techniques can be used on people-related issues, such as recruiting, performance evaluation, talent retention, talent development, job matching, team management, and organizational stability analysis. Finally, I will present two case studies: 1) recruitment market trend analysis with sequential latent variable models, and 2) talent circle detection in job transition networks.
个人简介:
熊辉教授本科于1995年毕业于中国科学技术大学,博士于2005年毕业于美国明尼苏达大学,目前为美国罗格斯-新泽西州立大学信息安全中心主任、罗格斯商学院管理科学与信息系统系副系主任、正教授 (终身教授)、RBS院长讲席教授,并担任中国科学技术大学大师讲席教授。熊辉教授在研究领域成绩斐然,获得的部分荣耀包括ACM杰出科学家,长江讲座教授,海外杰青B类(海外及港澳学者合作研究基金), IBM 创新奖, ICDM-2011最佳研究论文奖,罗格斯-新泽西州立大学最高学术奖—the Rutgers University Board of Trustees Research Fellowship for Scholarly Excellence (2009)。 主要学术成果包括:1本专著;3本编著,其中Encyclopedia of GIS(Springer)被评为最受欢迎前十名的Springer华人作者的计算机著作; 学术论文200余篇,其中有60余篇发表在包括 IEEE Transactions on Knowledge and Data Engineering、VLDB Journal、IEEE Transactions on Fuzzy Systems、Machine Learning、IEEE Transactions on Systems, Man, and Cybernetics - Part B、IEEE Transactions on Mobile Computing在内的顶级权威刊物上,有32篇发表在数据挖掘的顶级学术会议 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD)上。
​熊辉教授目前担任Encyclopedia of GIS (Springer)的共同主编,并担任IEEE Transactions on Data and Knowledge Engineering (TKDE), IEEE Transactions on Big Data (TBD), ACM Transactions on Knowledge Discovery from Data (TKDD) and ACM Transactions on Management Information Systems (TMIS)的副主编,曾担任了多个会议的组织和程序委员,其中包括KDD-2012的企业及政府主题的共同程序主席,IEEE 2013 International Conference on Data Mining (ICDM)的共同程序主席,以及IEEE-2015的共同大会主席。
​熊辉教授的研究工作被Forbes, Xinhua News Agency, the Economist, Harvard Business Review, and the Wall Street Journal等媒体广泛报道。其中,经济学人杂志(the Economist)在2016年专文重点介绍了熊教授利用大数据技术预防犯罪的研究工作 (Economist Article Title: Cutpurse capers),同时哈佛商业评论在2016年也以专文重点介绍他的关于人力大数据分析的前沿工作。
​在人才培养方面,熊辉教授指导的五名博士毕业生均成为美国知名大学TENURE-TRACK助理教授,包括田纳西大学 (University of Tennessee-Knoxville) 、亚利桑那大学 (University of Arizona)、纽约州立大学石溪分校(Stony Brook University)、密苏里科技大学(Missouri University of Science and Technology)、和德雷塞尔大学 (Drexel University)。

谭昶: 讯飞大数据的实践与思考
摘要:以大数据、人工智能等为代表的新一代信息技术,正在从每一个细微的角落改变整个人类社会,更加精准、更加智能的信息服务需求快速增长。作为人工智能技术的领军企业和一家拥有8.9亿用户的互联网企业,如何运用人工智能技术从自有大数据中深度挖掘更多价值,促使大数据和人工智能技术更加紧密的结合,正是科大讯飞所要探索、实践和反复思考的。
个人简介:
谭昶,中国科学技术大学计算机应用技术博士,现任科大讯飞大数据研究院 副院长,中国计算机学会大数据专家委员会委员。主要从事数据挖掘和推荐系统技术的研究和推广应用,曾为中国移动、北京铁路局、华泰保险等企业提供大数据咨询与技术服务。目前负责科大讯飞公司智慧城市、计算广告和个性化推荐方向的大数据核心技术研发及应用推广工作。

陈文光:基于图计算的高性能大数据分析系统Gemini
摘要:现有大数据分析系统,如MapReduce和Spark,主要以编程的简易性、可扩展性和容错能力为设计原则,牺牲了平台的处理性能。我们将讨论容错与性能的关系,指出性能与容错并非是相互排斥的设计理念,并介绍高性能分布式图计算系统的实例Gemini。Gemini在图的划分方法、数据结构、局部性优化、细粒度负载平衡和通信与计算重叠方面提出了一系列优化技术。在典型的图处理应用中,该系统需要的内存是约为GraphX的十分之一,性能是Spark GraphX的100倍以上。
个人简介:
陈文光,清华大学计算机系教授,主要研究领域为并行与分布式系统的编程系统。现为中国机算机学会杰出会员和杰出讲者,副秘书长;ACM中国理事会副主席,ACM中国操作系统分会ChinaSys主席。

陈海波:基于HTM/RDMA的可扩展内存事务处理系统
摘要:内存计算能够提供相对于磁盘为中心计算超过1000倍的数据访问速度,这也为提升事务处理速度提供了新的机遇。 该报告将介绍我们最近以提供每秒数百万次事务每秒内存事务的研究工作。 具体来说,我将介绍如何利用诸如HTM和RDMA之类的新型硬件特性来提供更好的单节点和分布式内存交易,如何改进操作系统和处理器架构以进一步简化和改进内存中事务处理,以及如何根据需要调整并发控制协议。
个人简介:
陈海波,上海交通大学教授、博士生导师,CCF杰出会员、杰出演讲者,ACM/IEEE高级会员。主要研究方向为系统软件与系统结构。入选2014年国家“万人计划”青年拔尖人才计划,获得2011年全国优秀博士学位论文奖、2015年CCF青年科学家奖。目前担任ACM SOSP 2017年大会主席、ACM APSys指导委员会主席、《软件学报》责任编辑、《ACM Transactions on Storage》编委等。多次担任SOSP、ISCA、Oakland、PPoPP、EuroSys、Usenix ATC、FAST等国际著名学术会议程序委员会委员。在SOSP、OSDI、EuroSys、Usenix ATC、ISCA、MICRO、HPCA、FAST、PPoPP、CCS、Usenix Security等著名学术会议与IEEE TC、TSE与TPDS等著名学术期刊等共发表60余篇学术论文,获得ACM EuroSys 2015、ACM APSys 2013与IEEE ICPP 2007的最佳论文奖与IEEE HPCA 2014的最佳论文提名奖。研究工作也获得Google Faculty Research Award、IBM X10 Innovation Award、NetAPP Faculty Fellowship与华为创新价值成果奖等企业奖励。

高阳:交互型数据的分析与学习
个人简介:
高阳: 目前任南京大学计算机科学与技术系副主任,人工智能教研室/实验室副主任,2009年入选江苏省“333高层次人才培养工程”第二批中青年科学技术带头人,2010年入选教育部新世纪优秀人才计划。近年来从事大数据、人工智能、机器学习、多Agent系统、图像和视频分析等方向的学术研究。作为第一负责人主持国家自然科学基金重点项目一项,国家自然科学基金面上或青年项目四项,主持科技部国际合作专项一项,江苏省自然科学基金重点项目(江苏省973项目)一项。基于所研究成果,在国际杂志(IEEE Tranx系列)、国际会议(CCF-A/B类会议)和国内一级刊物上(计算机学报、软件学报等)发表学术论文数100余篇。获授权专利10项,国际PCT专利1项。目前担任中国人工智能学会理事/机器学习专业委员会副主任/粗糙集与软计算专业委员会副主任;中国计算机学会大数据专家委委员/人工智能与模式识别专业委员会常委/南京分部副主席;江苏省计算机学会人工智能专业委员会副主任等。

沈华伟:社会媒体数据挖掘与信息传播预测
摘要:近年来,以微博、微信等为代表的社会媒体逐渐成为人们发布、传播和获取信息的主要媒介。社会媒体汇聚了大量的用户关系数据和信息传播数据,为分析和研究人类社会活动提供了弥足珍贵的数据资源。社会媒体中数据多源异构、个体间关系繁杂、信息传播突发等特点给社会媒体分析提出了科学技术挑战。分析社交网络的结构规律、挖掘用户行为的固有模式、探索网络信息传播的内在机理、研究高效的社交网络分析与网络信息传播预测方法,有利于提升对在线社会媒体的科学认知水平和有效利用能力。报告将从网络结构分析、网络表达学习、网络信息传播预测等几个方面介绍报告人近几年在社会媒体数据挖掘与信息传播预测方面的研究成果及其具体应用。
个人简介:
沈华伟,博士,中国科学院计算技术副研究员,中国中文信息学会社会媒体处理专委会副主任。研究方向为网络科学和社会计算。先后获得过CCF优博、中科院优博、首届UCAS-Springer优博、中科院院长特别奖、入选首届中科院青年创新促进会、中科院计算所“学术百星”。2013年在美国东北大学进行学术访问。2015年被评为中国科学院优秀青年促进会会员(中科院优青)。获得国家科技进步二等奖、北京市科学技术二等奖、中国电子学会科学技术一等奖、中国中文信息学会钱伟长中文信息处理科学技术一等奖。出版个人专/译著3部,在网络社区发现、信息传播预测、群体行为分析、学术评价等方面取得了系列研究成果,在Science、PNAS等期刊和WWW、SIGIR、CIKM、WSDM、AAAI、IJCAI等会议上发表论文60余篇,引用1700余次。担任PNAS、IEEE TKDE、ACM TKDD等10余个学术期刊审稿人和WWW、CIKM、WSDM等20余个学术会议的程序委员会委员。
刘威:图像描述生成
摘要:近年来,图像描述生成已经成为人工智能的研究热点。图像描述生成不仅仅需要深度理解图像内容,并且同时需要对文本信息进行理解建模。图像描述生成可以给图像提供更丰富的语义信息,进而应用于腾讯的多个产品中,譬如:图像搜索,图像对话,相册描述,图像推荐等。现阶段,使用端到端的深度网络模型(CNN+LSTM),能够高效的学习图像的表示并且生成相应的文本内容。在这次报告中,我们首先介绍图像描述生成的代表性的端到端的深度模型。其次介绍一下腾讯AI Lab视觉中心在图像描述生成以及图像文本双向搜索方面的探索。
个人简介:
刘威是腾讯AI Lab计算机视觉中心总监,负责图像视频数据相关的AI研究。刘威于2012年获得美国哥伦比亚大学计算机科学与电子工程博士学位,曾任IBM沃森研究中心研究科学家。刘威博士获得2011年度Facebook博士研究生奖学金,2013年度哥伦比亚大学优秀博士论文奖,2014年度计算机视觉与模式识别国际会议 (CVPR) 青年研究者奖,2016年度国际信息检索大会 (SIGIR) 最优论文荣誉奖。刘威博士长期从事计算机视觉、机器学习、数据挖掘、信息检索等领域的基础研究和产品开发,迄今发表和录用论文100+篇,总引用次数据Google Scholar统计为4000+次,论文大都发表在国际权威的期刊与会议上,如Proceedings of the IEEE,IEEE TPAMI,NIPS,ICML,KDD,CVPR,ICCV,ECCV,IJCAI,AAAI,UAI,SIGIR,SIGCHI等。刘威博士多次担任国际权威期刊的客座编委与审稿人,现任国际期刊Pattern Recognition的Associate Editor,自2007年起一直担任国际顶级会议NIPS、CVPR、ICCV等的程序委员会成员,自2014年起担任美国自然科学基金信息与智能系统分部 (NSF IIS Division) 的研究项目评审。
分享