阿里云周靖人:全新开源大模型 Qwen-14B 提供更强大的认知等能力

据 36 氪 9 月 25 日报道,阿里云智能首席技术官周靖人在通义千问开源发布会上宣布,将全新开源性能更强的大模型 Qwen-14B,该模型基于 140 亿参数,3 万亿 token 训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的 QWEN-7B(v1.1)模型能力普遍提升,核心指标最高提升 22.5%。

本文链接:https://www.8btc.com/article/6833884
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:https://www.xmlm.net/bhq/26794.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注