CMU 博士击破 LLM 的安全护栏,大语言模型全面沦陷

据新智元报道,CMU 博士发现的新方法击破了 LLM 的安全护栏,一夜之间,ChatGPT、Bard、羊驼家族忽然被神秘 token 攻陷,无一幸免。CMU 和人工智能安全中心的研究人员发现,只要通过附加一系列特定的无意义 token,就能生成一个神秘的 prompt 后缀。由此,任何人都可以轻松破解 LLM 的安全措施,生成无限量的有害内容。

本文链接:https://www.8btc.com/article/6827854
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bhq/25664.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注