报告题目:“知识图谱+语言模型”赋能AI科学发现
报告摘要:语言理解和知识表示是认知人工智能的两个核心研究命题。知识图谱作为一种结构化的知识表示手段,在生物医药、商务金融、情报安全、科技教育等众多领域发挥出重要的实用价值。近年来,以ChatGPT为代表的大型语言模型技术快速兴起,为理解人类语言和处理人类知识提供了全新的技术思路。相比于通用域和常识域,科学发现依赖特有的科学语言来表示科学知识,例如,蛋白质序列语言体现出和人类自然语言同样的序列形式,但和自然语言又有较多差异;化学语言如SMILE/SELFIE等可用于描述复杂的分子结构,比之自然语言,更加需要刻画原子分子层的复杂图结构关系以及三维空间表示。本报告首先分别从知识图谱和大型语言模型两个视角总结了人工智能相关发展趋势,然后探讨了利用知识图谱和语言模型来表示科学知识和处理科学语言的方法和思路,最后结合化学元素知识图谱、功能提示增强的分子图对比学习、本体驱动的蛋白质预训练、蛋白质提示学习模型等方面介绍了相关的研究成果及进展。
个人简介:陈华钧,浙江大学计算机科学与技术学院教授、博导,主要研究方向为知识图谱、大数据系统、自然语言处理等,以一作或通讯作在Nature Communications、Nature Machine Intelligence、NeurIPS、ICML、ICLR、IJCAI、AAAI、ACL、EMNLP、KDD、VLDB、ICDE、WWW、SIGIR、Brief. in Bioinformatics、Nucleic Acids Res. 、Proc. IEEE等国际顶级会议或期刊上发表多篇论文。作为负责人主持国家自然科学基金重大研究计划重点项目、国家自然科学基金联合基金重点类项目,以及国家重点研发计划、国家重大科技专项及企业合作项目等三十余项。曾获国际语义网会议ISWC2006最佳论文奖、浙江省科技进步二等奖、教育部技术发明一等奖、中国中文信息学会钱伟长科技奖一等奖、国家科技进步二等奖、深圳市科技进步一等奖、阿里巴巴优秀学术合作奖、中国工信传媒出版集团优秀出版物一等奖等奖励。担任浙江省数智科技研究会副会长、Elsevier Big Data Research主编等学术服务工作。浙江省有突出贡献中青年专家,浙江省高层次人才特殊支持计划(万人计划)科技创新领军人才。
主办单位:yl6809永利官网
报告时间:2023年5月25日(星期四)上午10:00
报告地点:正新楼三楼yl6809永利官网报告厅