讲习班介绍
为进一步普及最新大模型前沿动态,推动国内大模型技术发展,发展基础理论与应用,中国中文信息学会《前沿技术讲习班》(CIPSATT)将推出大模型系列专题,首期将于2023年6月30日-7月2日在深圳线下举办。讲习班以大模型为主题,邀请了来自国内研究第一线的知名青年专家学者,系统讲述大规模预训练语言模型的基础知识、面临挑战和应用场景,为感兴趣的学者、学生和工程师提供系统学习和交流的机会,快速了解大模型前沿方向的基本概念、研究内容和发展趋势。
大模型系列讲习班预告
北京站 - 8月
济南站 - 9月
昆明站 - 10月
合肥站 - 11月
哈尔滨站 - 12月
讲习班信息
时间:2023年6月30日-7月2日
地点:中国科学院深圳先进技术研究院A504
地址:广东省深圳市南山区学苑大道1068号
日程安排
本次讲习班内容涵盖大模型的多个方面,包括八大主题:
主题1:从NLP技术到LLM技术
主题2:从零构建大规模预训练语言模型
主题3:垂直领域大模型构建
主题4:大模型微调技术
主题5:大模型价值对齐
主题6:大模型评测方法
主题7:多模态大模型构建
主题8:大模型产业应用
详细日程安排
特邀讲者
/ 中国人民大学 /
赵鑫 教授
讲者简介:赵鑫,现为中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文100余篇,谷歌学术引用1万余次,曾主导研发了伯乐(推荐系统库RecBole)、妙笔(文本生成库TextBox)等开源工具。荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖(Test of Time Award)、RecSys 2022最佳学生论文提名(Best student paper runner-up)、CIKM 2022最佳资源论文提名(Best resource paper runnerup)等,入选中国科协青年人才托举工程、北京智源青年科学家、CCF-IEEE CS青年科学家。
/ 香港中文大学(深圳)/
王本友 助理教授
讲者简介:王本友,香港中文大学(深圳)数据科学学院助理教授和医疗健康信息研究中心副主任、深圳市大数据研究院兼职研究科学家。2022年在意大利帕多瓦大学获得博士学位,曾经在腾讯和华为诺亚方舟实验室工作或实习过。主要研究方向为自然语言处理(NLP)、应用机器学习、和信息检索。迄今为止,他曾获得了SIGIR 2017最佳论文提名奖、NAACL 2019最佳可解释NLP论文、NLPCC 2022最佳论文、华为火花奖和欧盟玛丽居里奖学金;主要研究工作发表在ICLR和NuerIPS,长期担任ICLR、NeurIPS、ICML、ACL、EMNLP审稿人。共发表了包括国际顶级会议20余篇,撰写的《推荐系统与深度学习》由清华大学出版社出版。曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。其团队开发的大模型包括多语言大模型凤凰(支持中文)、英文大模型Chimera以及医疗健康垂直领域大模型华佗GPT。
/ IDEA研究院 /
王瑞
讲者介绍:王瑞,哈尔滨工业大学(深圳)硕士毕业,曾就职于华为技术有限公司,现任IDEA研究院认知计算与自然语言研究中心(CCNL),大模型有监督指令微调团队算法负责人,也是开源“姜子牙”系列大模型SFT阶段的负责人。
/ 哈尔滨工业大学(深圳)/
李晶 教授
讲者简介:李晶,哈尔滨工业大学(深圳)计算机科学与技术学院教授,博士生导师,国家优青基金(海外)获得者。分别于2010年、2013年在电子科技大学取得学士和硕士学位,2018年于新加坡南洋理工大学取得博士学位。2018年至2019年,在新加坡南洋理工大学担任博士后;2019到2023年,在阿联酋起源人工智能研究院任研究科学家。其主要研究方向为自然语言处理、信息检索、大模型高效微调与大模型安全等,具体领域包括:信息抽取与知识获取、知识图谱、迁移学习、元学习等。近年来在IEEE TKDE, SIGIR, WWW, ACL, ICDE, AAAI, IJCAI等国际重要学术会议和期刊发表论文近40多篇,合编专著1部《人工智能:知识图谱前沿技术》,常年担任多个国际会议程序委员会成员和期刊的审稿人。研究成果被应用于新加坡和阿联酋多个国家级项目。
/ 天津大学 /
熊德意 教授
讲者简介:熊德意,天津大学智能与计算学部教授、博士生导师,自然语言处理实验室负责人,天津市“一带一路”联合实验室语言智能与技术中外联合研究中心主任。主要研究方向为自然语言处理,特别专注于机器翻译、自然语言对话、大语言模型、常识推理、认知计算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文150余篇,出版中英文专著各一部。获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金、工信部人工智能产业创新任务揭榜挂帅、云南省科技厅重点研发计划等项目资助。获得新加坡资讯通信研究院2008年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会中文信息处理科学技术奖青年创新奖一等奖等奖项。担任IALP 2012&2021程序委员会共同主席,CWMT 2017程序委员会共同主席,NeurIPS、ACL、EMNLP、NAACL、COLING、AACL等多个知名国际会议的领域主席、赞助主席、演示主席等,以及TACL和ARR的Action Editor等。领导研制了仁文伏羲大模型,与华为、阿里、字节跳动、OPPO等多家知名企业开展了深入合作。
/ 上海交通大学 /
何俊贤 助理教授
讲者简介:何俊贤,上海交通大学John Hopcroft Center助理教授。2022年于卡内基梅隆大学计算机科学学院获得博士学位。研究关注语言模型、文本生成、深度生成模型等。担任ACL和EMNLP的领域主席。论文入选ACL 2019最佳系统论文提名、ICLR 2022最有影响力论文之一。曾获百度博士奖学金、AI华人新星百强等荣誉。
/ 微软亚洲研究院 /
吴晨飞 高级研究员
讲者简介:吴晨飞博士,微软亚洲研究院高级研究员。研究方向为大模型预训练、多模态理解和生成。主要研究工作包括多模态生成模型NUWA(女娲)系列(NUWA, NUWA-LIP, NUWA-Infinity, NUWA-3D, NUWA-XL)、多模态理解模型Bridge Tower(桥塔)系列(KD-VLP, Bridge-Tower, Manager-Tower)以及多模态对话系统(TaskMatrix.AI)。在CVPR, NeurIPS, ACL, ECCV, AAAI, MM等会发表多篇论文。
/ 微软亚洲研究院 /
刘树杰 高级研究员
讲者简介:刘树杰 微软亚洲研究院高级研究员和研究经理,2012年博士毕业于哈尔滨工业大学。2012年加入微软亚洲研究院,从事自然语言处理、语音处理以及机器学习相关工作。在自然语言处理和语音处理各顶级期刊和会议上发表论文100余篇,并合著《机器翻译》一书,参与编写《人工智能导论》一书。获得国际自然语言和语音处理评测比赛多项第一。担任多个国际会议审稿人及领域主席。其研究成果被广泛应用于Microsoft Translator、Skype Translator、Microsoft IME和微软语音服务等微软重要产品中。
/ 腾讯AI Lab /
焦文祥 高级研究员
讲者简介:焦文祥,腾讯AI Lab高级研究员,香港中文大学博士,师从金国庆教授与吕荣聪教授;本科和硕士就读于南京大学。研究方向:神经机器翻译、多语言机器翻译和通用大模型翻译,相关研究工作发表于ACL、EMNLP、TASLP等国际顶级会议和期刊。曾参加2022年WMT国际顶级翻译评测比赛,并夺得“大规模非洲多语言翻译任务(受限制赛道)”第一名。研究工作“Adapters for Enhanced Modeling of Multilingual Knowledge and Text”被2022年EMNLP多语言表示学习研讨会授予“最佳论文奖”。
/ 同济大学 /王昊奋 特聘研究员
个人简介:王昊奋,同济大学百人计划,特聘研究员,博士生导师。研究方向包括知识图谱、自然语言处理、对话问答机器人等。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责主持多项国家级和上海市AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到2900余次,H-index达到26。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
李长亮 人工智能专家
个人简介:李长亮,博士,人工领域专家,多次获得 AI 领域国际顶级评测冠军,发表国际会议期刊论文数十篇,申请发明专利 200 余项,主持多项国家省部级课题,累计科研经费数亿元。
会议组织
孙乐,中国科学院软件研究所
杨敏,中国科学院深圳先进技术研究院
户保田,哈尔滨工业大学(深圳)
张家俊,中国科学院自动化研究所
覃立波,中南大学