第十三届中国中文信息学会暑期学校暨中国中文信息学会《前沿技术讲习班》第八期和第九期(CIPSATT 8&9)在北京语言大学召开。论坛由中国中文信息学会和中国中文信息学会学术工作委员会主办,北京语言大学承办。本次讲习班主题分别为:深度学习与文本分析;深度学习新进展及其在自然语言处理中的应用。讲习班吸引了来自全国各高校及科研院所的专家、学者、学生、产业界研发人员等近400人。
中国中文信息学会学术工委主席、清华大学马少平教授,中国中文信息学会副理事长兼秘书长、中国科学院软件研究所孙乐研究员担任本次讲习班的主席;中国科学院自动化研究所刘康副研究员、中国科学院软件研究所韩先培副研究员担任学术主席;北京语言大学于东副教授担任组织委员会主席。
开幕仪式上孙乐研究员介绍了中国中文信息学会基本情况和前沿技术讲习班的定位。刘康和韩先培副研究员介绍了本次暑期学校的两个主题以及时间安排等。
本次讲习班邀请了复旦大学计算机科学技术学院邱锡鹏副教授、清华大学刘知远副教授、哈尔滨工业大学计算机学院车万翔教授、中国科学院自动化研究所张家俊副研究员、腾讯AI Lab高级研究员涂兆鹏博士、南京大学俞扬副教授、中科院计算所网络数据科学与技术实验室徐君研究员、中科院计算所网络数据科学与技术实验室助理研究员庞亮博士、香侬科技创始人&CEO李纪为博士以及加州大学-圣塔芭芭拉分校William Wang博士在不同的领域做了系统深入的讲解,并对深度学习以及各个领域的应用提出了未来的研究方向。
邱锡鹏副教授作题为《深度学习基础》的报告,该报告分析了深度学习技术目前在学术界和工业界取得了广泛的成功并逐渐受到了高度重视的原因,并梳理机器学习与深度学习的整体脉络、主要模型、以及最新进展,使得听众可以掌握深度学习的基本原理,培养深度学习的思维模式,独立规划和开发AI项目,为后续的课程提供了良好的铺垫。
邱锡鹏副教授作题为《深度学习基础》的报告
刘知远副教授的报告题目为《语义表示学习》。他介绍了分布式学习为什么会成为当前深度学习的基本特征,以及如何影响了计算机视觉、自然语言处理和语音识别等无结构信息的处理。报告主要讲授面向自然语言处理的语义表示学习的基本原理与技术,介绍面向汉字、词汇、短语、知识和网络等研究对象的语义表示学习的基本思想,并展望在该方向的主要挑战与前沿方向;并且根据其研究组投稿的情况,给了参会学者非常真实的顶级会议投稿意见,以及未来的研究方向;建议作一些更具有创新性的工作,如他们研究组基于Hownet进行的相关研究。
刘知远副教授作题为《语义表示学习》的报告
车万翔教授作题为《深度学习与词法、句法、语义分析》的报告。该报告将词法、句法和语义分析是自然语言处理的基础研究任务统一抽象为自然语言处理独有的构预测问题。他以词法分析(分词、词性标注)、句法分析(依存句法分析、短语结构句法分析)和语义分析(语义角色标注、 语义依存分析)为例,介绍基于深度学习的结构预测方面的最新研究进展。具体包括:首先,介绍基本的使用贪婪搜索进行结构预测的方法;接着,介绍基于动态规划等全局搜索的方法,与前一种方法一样,它们都使用深度学习的方法学习特征的表示;最后,介绍如何在学习的过程中使用全局搜索方法,进一步提高系统的准确率。该报告将传统的自然语言处理的任务转换为深度学习的任务,能够更好地服务与自然语言处理相关的研究人员。
车万翔教授作题为《深度学习与词法、句法、语义分析》的报告
张家俊副研究员和涂兆鹏博士共同作题目为《深度学习与机器翻译》的报告。该报告详细介绍了神经机器翻译,认为目前基于端到端的神经机器翻译逐渐取代统计机器翻译,成为新的研究范式,基于深度学习的机器翻译方法已经成为了研究者和产业界的基线系统。该报告介绍了传统统计机器翻译的不足,深度神经机器翻译如何克服这些问题。同时,该报告也给出了目前神经机器翻译的不足,以及一些将统计机器翻译和神经机器翻译结合的方法。
张家俊副研究员作题为《深度学习与机器翻译》的报告
涂兆鹏博士作题为《深度学习与机器翻译》的报告
俞扬副教授的报告题目为《深度强化学习与GAN基础》。该报告介绍了强化学习的基本原理和解决的主要问题类型,以及近年来强化学习与深度学习的结合。报告还介绍了模仿学习(imitation learning),该方法主要针对强化学习的一些主要问题,例如样本效率低。同时介绍了逆强化学习、基于对抗的强化学习等模型。该报告还介绍了他在强化学习上的一些尝试和经验,给出了强化学习的适用环境等,为后续相关的研究人员提供了重要的借鉴信息。
俞扬副教授作题为《深度强化学习与GAN基础》的报告
徐君研究员和庞亮博士就深度学习在信息检索领域的研究作题为《信息检索中的深度强化学习新进展》的报告。该报告介绍了深度学习如何以其强大的表示能力来解决信息检索中的经典问题“匹配学习”和“排序学习”,以及近年来深度学习在信息检索领域中的应用。同时该报告还介绍了如何利用强化学习来增强信息检索以及如何通过代价更小的方式来进行模型的学习和反馈信息的采集。这不仅为研究人员提供了借鉴价值,更为产业界提出了新的优化思路。
庞亮博士作题为《信息检索中的深度强化学习新进展》的报告
徐君研究员作题为《信息检索中的深度强化学习新进展》的报告
李纪为博士针对当前非常热的对话系统,作题为《对话系统中的深度学习进展》的报告。该报告从实用的角度出发,介绍了如何使用深度学习来解决对话系统中的关键问题,包括如何产生有意思、有信息量的回复;如何利用上下文产生更确切的回复;如何保持谈话的一致性;如何产生更持久的对话;如何给机器赋予提问的能力。最后该报告指出了深度对话系统未来的研究趋势,为研究人员和相关的从业公司提供了参考意见。
李纪为博士作题为《对话系统中的深度学习进展》的报告
王威廉博士作题为《Recent Advances in Knowledge Graph Construction and Reasoning》的报告。该报告针对目前基于各种学习算法产生的大规模的质量不高的知识图谱的现状,讲述如何做进一步的优化。报告的内容包括基于距离监督的关系抽取、知识图谱表示和知识图谱的推理三个主要方向。从三个不同的角度对于已有知识图谱进行优化和补全工作。并且从其自身对该领的理解,展望知识图谱的未来研究方向。
王威廉博士作题为《Recent Advances in Knowledge Graph Construction and Reasoning》的报告
历届暑期学校均获得广大师生的普遍好评,也为自然语言技术的人才培养和技术推广做出了卓越贡献。数以千计的学子在暑期学校中得到了来自国内外著名高校和科研机构知名学者的当面指导,受益匪浅。
会场内景