中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

计算材料学 2024-10-04 08:48

文章摘要

本文介绍了中国科大和科大讯飞团队开发的ChemEval，一个专门用于评估化学领域大语言模型（LLMs）能力的多层次多维度评估框架。ChemEval通过一系列精心设计的任务，覆盖了从基础化学知识到高级化学概念的多个层面，旨在全面评估LLMs在化学领域的理解和应用能力。研究动机在于现有的基准测试大多仅面向基础概念的问答，缺乏对化学领域更深层次能力的评估。ChemEval的开发填补了这一空白，为化学领域中的LLMs应用提供了宝贵的评估和见解，同时也为未来模型的优化和应用开辟了新的道路。

中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

阅读全文

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

最新文章

广东工业大学马琳教授课题组招收2026年博士（材料物理与化学、光学专业）

导师简介：马琳，博士，教授，博士生导师，广东省珠江人才计划青年拔尖人才。2010年本科毕业于吉林大学物理学院光信息科学与技术专业。2014年博士毕业于新加坡南洋理工大学物理与应用物理专业。2

19小时前

大连理工大学智能感知器件与系统课题组诚招博士后、硕博生、科研助理

一、研究院介绍大连理工大学人工智能学院-机器人与智能系统研究院拥有院士领衔的师资队伍，学院简介详见：https://robot.dlut.edu.cn/index.htm二、课题组介绍课题组致力于功能

19小时前

宁波东方理工大学王长虹团队招收博士生研究生、博士后

一、单位简介宁波东方理工大学是一所由虞仁荣教育基金会等社会力量举办、国家重点支持、省市共同建设的小而精、高起点、高水平、国际化的新型研究型大学，由国际知名教育家、中国科学院院士陈十一担

19小时前

安工大徐杰/复旦王永刚JEC: 氟化分子工程调控COF结构实现抗高温自放电的锂硫电池

01引言锂硫电池因其高理论能量密度和低成本优势，被视为极具竞争力的下一代储能系统。然而，多硫化物的“穿梭效应”、锂负极的不稳定性以及对温度波动（尤其是高温）的耐受性不足，严重制约了其商业化进程。在高温

20小时前