DeepMind:大型语言模型可实现“高效无损压缩音频影像”,有望运用于相关软件中

据 IT 之家 9 月 27 日消息,DeepMind 研究人员日前评估大型语言模型(LLM)的压缩能力时,发现这些模型的“压缩能力”相当惊人,除了常规文字资料外,还可以压缩图像音频,相关内容已经发布在 ArXiv 上。

据悉,DeepMind 在研究中,使用了一个名为“Chinchilla 70B”的模型,虽然这个模型主要使用文字训练,但是研究人员发现该模型也可用于压缩 ImageNet 图片,可将文件压缩至原始大小的 43.3%,甚至可将 LibriSpeech 语音样本压缩至原始的 16.4%。

DeepMind 的研究证明,模型的“预测”能力和“压缩”能力之间存在“等价性”,因此研究人员可以使用任何压缩算法,建立一个更加强大的条件生成模型。研究还发现,若要将模型用于压缩上,模型并非越大越好,过大的模型可能反而对压缩能力产生负面影响。

本文链接:https://www.8btc.com/article/6834164
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:https://www.xmlm.net/bhq/26850.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注