C-Eval 中文大模型权威排名公布:ChatGLM2 和 GPT-4 排名前二

据 36 氪 7 月 24 日报道,C-Eval 全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的 ChatGLM2、OpenAI 的 GPT-4、商汤的 SenseChat,APUS 的 AiLMe-100 Bv1。

C-Eval 是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含 13948 道多项选择题,涵盖 52 个不同学科和四个难度级别。

本文链接:https://www.8btc.com/article/6827212
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bhq/25549.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注