Meta发布多模态文本与图像生成模型CM3leon

据Odaily星球日报消息,7月14日,Meta发布多模态语言模型CM3leon。CM3leon是一种检索增强、基于标记、仅解码器的多模态语言模型,能够生成和填充文本与图像。CM3leon是第一个使用改编自纯文本语言模型的配方进行训练的多模态模型,包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。作为一个通用模型,它可以进行文本到图像和图像到文本的生成,能够引入产生高质量输出的独立对比解码方法。

本文链接:https://www.8btc.com/article/6826190
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bhq/25368.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注