2016年9月19-22日,全国知识图谱与语义计算大会(CCKS 2016)在北京西郊宾馆隆重召开。本次会议由中国中文信息学会语言与知识计算专业委员会主办。大会分为讲习班和主会两个主要部分,本次讲习班暨中国中文信息学会《前沿技术讲习班》ATT第三期的主题是知识图谱专题。本次大会吸引了来自全国学术界、产业界从事知识图谱相关研究的400多人参加,会议探讨了知识图谱领域的新发现、新技术和新应用,旨在向社会公众介绍知识图谱相关领域的发展趋势和创新成果,进一步推动我国知识图谱技术领域的发展。CCKS 2016会议的主题是:语义、知识与链接大数据。
会议包括学术讲习班、特邀报告、工业界论坛、评测与竞赛、学术论文、海报及演示等主要环节。其中,前沿技术讲习班邀请了8位国内外知名研究者,分别是:奇点机智的林德康博士、文因互联的鲍捷博士、阿伯丁大学的Jeff Z. Pan教授、华东理工大学的阮彤教授、Facebook的王海勋博士、微软的王仲远博士、南京大学的胡伟博士和南京大学的程龚博士,为大家分享了4个前沿技术讲座。特邀报告邀请了4位国内外的知名研究者,他们分别是:牛津大学的Ian Horrocks教授、马普研究所的Gerhard Weikum教授、北京理工大学的黄河燕教授和Facebook的王海勋博士。工业界论坛邀请了产业界的8位研发人员,分享了实战经验,他们分别是:Franz.的科学家Sheng-Yhuan Wu、拓尔思的副总裁刘瑞宝、云知声的AI技术专家刘升平、小i机器人的陈培华研究员、海云数据的CTO赵丹、海翼知的CEO丁军、富士通的研究员Nobuyuki Igata和图灵机器人的技术负责人韦克礼。
大会现场
9月19-20日是中国中文信息学会《前沿技术讲习班》ATT第三期:知识图谱专题。讲习班由清华大学朱小燕教授主持开班仪式。19号上午第一个讲座是林德康博士和鲍捷博士的《实战中的知识图谱》。在报告中鲍捷博士回顾了知识图谱从理论到工程逐步落地的发展历程,梳理了各技术与知识图谱应用的关系;并且结合工程商具体的实例,展示了知识图谱的核心理念和技术如何在成本约束下实施,包括结构化数据生成,可维护的知识结构,海量知识的数据库管理,和多层次的语义检索等。林德康博士探讨了知识图谱在搜索,自动问答等应用中如何与统计机器学习方法相结合来解决实际问题。19下午由Jeff Z. Pan教授和阮彤教授作讲习班的第二个讲座《Testing and Assessing the Quality of Knowledge Graph》。Jeff Z. Pan教授介绍了知识图谱构建和重利用的质量控制等基本概念,还介绍了一种测试驱动的知识图谱结构构建方法。阮彤教授介绍了数据质量模型,数据质量评估模型,以及数据质量在大数据分析中所起到的重要角色。20日上午由王海勋博士和王仲远博士作讲习班的第三个讲座《Understanding Short Texts》。本报告介绍了短文本的理解方面的工作,短文本的理解方法可以分为两类:显式表示方法和隐式表示方法,报告对这两类方法进行了详细的介绍。具体的,介绍了短文本理解中需要用到的知识获取、知识表示和知识推理等相关技术。20日下午由胡伟博士和程龚博士作讲习班的第四个讲座《知识图谱的摘要和集成》。本报告首先介绍了知识图谱、链接数据和本体的基础知识,还介绍了知识图谱的摘要技术,其中重点介绍了实体描述摘要、实体关联摘要的最新研究进展;最后介绍了知识图谱的集成技术,重点介绍了本体匹配和实体链接技术的最新研究进展。
9月21-22日是本次大会的主会。开幕式由专委会主任清华大学李涓子教授主持,首先由中国中文信息学会理事长李生教授致辞,接着由大会主席中国科学院软件研究所孙乐研究员致辞,最后程序委员会主席浙江大学陈华钧教授介绍会议组织情况。
学会理事长李生教授致辞
大会主席中科院软件所孙乐研究员致辞
程序委员会主席浙江大学陈华钧教授致辞
本次会议共邀请了四位海内外知名学者做特邀报告。来自牛津大学的Ian Horrocks教授作《Using Semantic Technology to Tackle Industry’s Data VarietyChallenge》的报告。报告主要介绍了基于本体的数据库方法(Ontology Based Data Access),并展示了该方法是如何解决数据多样性这个挑战的。同时也介绍了OBDA这种方法的问题和局限性,并探讨了如何减缓这些问题。德国马普研究所的Gerhard Weikum教授作《What Computers Should Know》的报告。报告介绍了知识图谱的发展和应用,探讨了最新的研究方法如常识获取,并指出了新的机遇和挑战。北京理工大学的黄河燕教授作《面向基础教育的大数据类人智能答题系统总体设想及其困难与挑战》的报告。报告主要介绍了面向基础教育的大数据类人类智能答题系统的总体设想与方案、研究进展,尤其是其中所面临的难点与挑战,以及未来的研究重点与方向展望。Facebook的王海勋研究员作《Short Text Understanding》的报告。该报告主要介绍了短文本理解中所用到的知识获取、知识表示和知识推理方面的方法,并介绍了大量的可用于文本理解的结构化和半结构化的数据。
牛津大学Ian Horrocks教授做特邀报告
马普研究所Gerhard Weikum教授做特邀报告
北京理工大学黄河燕教授做特邀报告
Facebook王海勋研究员做特邀报告
会议同时设置了学术论文、海报及演示、知识图谱竞赛等环节。知识图谱竞赛部分还邀请了清华大学刘知远博士作《知识表示学习与知识获取》的报告。刘知远博士主要介绍和总结了他们在知识表示和知识获取方面的最新的研究进展。中科院自动化所的刘康博士和北京师范大学的王志春博士报告了评测的总体情况。同时多个评测参与单位也介绍了他们的系统和相关的经验。
在主旨为“知识图谱与认知智能”的论坛环节,该论坛由东南大学的漆桂林教授主持,邀请了学术界和工业界的5位学者和研究人员参与讨论,他们分别是:Franz.的科学家Sheng-Yhuan Wu、哈尔滨工业大学的秦兵教授、浙江大学陈华钧教授、微软研究院闫峻研究员、百度公司刘亦梁主任架构师,各位专家就知识图谱未来的发展各抒己见、热烈讨论。
Panel讨论环节
22日下午是知识图谱工业界论坛,邀请了8位工业界的研究人员作特邀报告,分享实验经验:Franz.的科学家Sheng-Yhuan Wu作《Analytic Knowledge Graph for Healthcare》的特邀报告,报告主要介绍了知识图谱在医疗领域的应用。拓尔思副总裁刘瑞宝作《拓尔思水晶球 – 基于动态本体的知识管理工具》的特邀报告,报告从实战的角度,分享了拓尔思水晶球获取知识、建立知识图谱、挖掘知识内涵的全过程。云知声的AI技术专家刘升平作《从语义到语用》的特邀报告,报告介绍了语用学的基本概念,进一步提出了语用计算,即把语用学用到人与机器的对话交互中,包括口语的理解,自然语言的生成,和人机交互框架。小i机器人的研究员陈培华作《小i机器人在中文语义开放平台的研究与进展》的报告,报告介绍了人工智能热点研究领域以及小i机器人在人工智能领域的布局;还介绍了小i机器人在自然语言处理领域的研究进展。海云数据CTO赵丹作《关联挖掘 – 图可视化的应用实践》的报告,报告通过行业实际使用场景,探讨了关联分析中图可视化的用途、作用与意义;以及实用关联分析系统的设计思路与方法。海翼知CEO丁军作《发现数据之美-大规模行业知识图谱的构建和应用》的报告,报告针对企业在数据整合与应用方面遇到的痛点,结合对海翼知大规模行业图谱的极少,分享了整合通用数据,行业数据以及企业私有数据的一些经验。富士通研究员Nobuyuki Igata作《Knowledge Graph in Japan: Open data beyond》的报告,报告介绍了在日语方面从开放数据构建知识图谱的相关工作。图灵机器人技术负责人韦克礼作《知识图谱在自动应答系统上的应用和挑战》的报告,报告分享了一些中文知识图谱构建的方法、策略,以及在自动问答系统中的应用;还分析了知识图谱构建中的一些难点,在应用中面临的一些挑战,并探讨了解决之道。
本次大会关注国内外知识图谱研究领域的最新进展,以及工业界的最新技术,对本领域面临的种种挑战性科学问题和关键技术难题展开了深入研讨,为所有与会者带来了一场学术与技术的饕餮盛宴。经语言与知识计算专委会2016年工作会议决定,2017年全国知识图谱与语义计算大会将在四川成都西华大学举办。