2012年12月20日至21日,由中国中文信息学会主办的"The Second CIPS-SIGHAN Joint Conference on Chinese Language Processing"在天津大学举行。本届评测任务共分为微博分词、中文人名消歧、简体中文句法分析、繁体中文句法分析四个子任务,来自北京大学、清华大学、东北大学、中科院软件所、澳门大学、布兰迪斯大学、苏州大学、交通大学,台湾师范大学、元智大学、朝阳大学等26家单位的学者参加了本次会议。
开幕式由大会主席、中国科学院软件研究所孙乐研究员主持。清华大学计算机科学与技术系朱晓燕教授作了题为"from Turing Test to Intelligent Information Service "的特邀报告,就目前的热门的大数据处理、智能信息挖掘,知识获取等热点问题作了深入精彩的论述;苏州大学自然语言处理实验室主任、计算机科学与技术学院周国栋教授作了题为"Linguistic foundation for NLP"的特邀报告,对自然语言处理领域语言学的应用做了全面的综述并对语言学的作用阐述了独特的见解。
会上各子任务的组织负责人对各个子任务的要求、技术难点、参赛队伍数、最终提交的结果、采用的技术方案及最终效果等情况做了相关统计汇报。其中中文人名消歧任务、微博分词任务的实验语料及各提交结果评测等相关工作由北京大学计算语言学研究所的王厚峰教授、穗志方教授等承担;简体中文句法分析任务的实验语料及结果评测等相关工作由清华大学信息技术研究院语音和语言技术中心的周强教授等人承担;繁体中文句法分析的实验语料及结果评测等相关工作由台湾元智大学的资讯管理学系的禹良治教授等人承担。各个任务的参赛队伍数量、提交系统、最好结果等统计情况如下表:
任务编号 | 任务名称 | 参赛队伍数 | 提交系统数 | 最好成绩 | |||
pre | rec | f | |||||
1 | 微博分词 | 17 | 20 | 0.946 | 0.9496 | 0.9478 | |
2 | 中文人名消歧 | 8 | 8 | 0.7948 | 0.8098 | 0.8022 | |
3 | 简体中文句法分析 | 8 | 12 |
Open PSG Tot4_LC_F1 |
Close PSG Tot4_LC_F1 |
||
0.8130 | 0.7627 | ||||||
4 | 繁体中文句法分析 | 8 | 12 | 子任务1 | 子任务2 | ||
Micro-F1: 0.7078 Macro-F1: 0.7211 | Micro-F1: 0.4394 Macro-F1: 0.4224 |
研究论文及评测报告阶段,与会者与演讲者就关注的问题进行了深入的交流研讨活动,会后学者就会议组织相关问题提出了宝贵的建议。
清华大学计算机科学与技术系朱晓燕教授作了题为"from Turing Test to Intelligent Information Service "的特邀报告 |
苏州大学自然语言处理实验室主任、计算机科学与技术学院周国栋教授作了题为"Linguistic foundation for NLP"的特邀报告 |