ASCII 字符画成注入工具 研究人员发现大模型越狱新手段

机器人技术 2025-03-24 12:54www.robotxin.com机器人技术

IT之家报道,最近一项引人注目的研究引起了广泛关注。据外媒Ars Technica透露,科研人员推出了一种名为Artprompt的新型大模型注入手段。这一技术巧妙地使用ASCII字符画替代关键文字进行提示输入,巧妙地绕过了大模型的安全防线。

让我们通过一个具体的例子来理解这一创新的手段。研究人员向大模型输入了关于“”主题的关键词的ASCII字符画,并指示大模型理解这些字符画所代表的词汇,然后用这些词汇替换提示中的占位符。结果令人震惊,大模型被成功地引导,给出了制造和分销的具体步骤。同样,这种技术还可以揭示出攻击物联网设备的方法。

为了验证Artprompt注入的实用性,研究人员在五个领先的模型上进行了测试,包括GPT-3.5、GPT-4、Gemini、Claude和Llama2。测试结果令人担忧,所有五个模型均未能抵挡这一新型注入手段的攻击,输出了不合规的内容。

这项研究揭示了令人深思的问题:如果语言模型仅依赖语义解释训练语料库,它们可能会缺乏对非语义直接解释提示词的识别。这一漏洞可以通过ASCII字符画等方式加以利用,引发了业界对于大模型安全性的新思考。这项研究警示我们,对于语言模型的进一步发展和应用,必须考虑到这些新兴的安全挑战。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by