Meta 发布新模型架构 Megabyte,比 Transformer 快四成

据《科创板日报》5 月 30 日报道,Meta 日前发布全新模型架构 Megabyte,这是一种多尺度解码器架构,可对超过一百万字节的序列进行端到端可微分建模,并可跨多种格式生成超过 100 万个 token。Meta 团队声称,Megabyte 能解决 Transformer 硬伤,速度还能提高 40%。

本文链接:https://www.8btc.com/article/6820080
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bhq/24439.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注