DeepMind：大型语言模型可实现“高效无损压缩音频影像”，有望运用于相关软件中

惊蛰财经 • 2023年9月28日 am1:15 • 未分类 • 阅读 119

据 IT 之家 9 月 27 日消息，DeepMind 研究人员日前评估大型语言模型（LLM）的压缩能力时，发现这些模型的“压缩能力”相当惊人，除了常规文字资料外，还可以压缩图像音频，相关内容已经发布在 ArXiv 上。

据悉，DeepMind 在研究中，使用了一个名为“Chinchilla 70B”的模型，虽然这个模型主要使用文字训练，但是研究人员发现该模型也可用于压缩 ImageNet 图片，可将文件压缩至原始大小的 43.3%，甚至可将 LibriSpeech 语音样本压缩至原始的 16.4%。

DeepMind 的研究证明，模型的“预测”能力和“压缩”能力之间存在“等价性”，因此研究人员可以使用任何压缩算法，建立一个更加强大的条件生成模型。研究还发现，若要将模型用于压缩上，模型并非越大越好，过大的模型可能反而对压缩能力产生负面影响。

本文链接：https://www.8btc.com/article/6834164
转载请注明文章出处

原创文章，作者：惊蛰财经，如若转载，请注明出处：https://www.xmlm.net/bhq/26850.html