推广 热搜：迅达热水器长虹空调老板燃气灶日立空调美的燃气灶威能热水器怡和智能马桶万和燃气灶三菱空调尔中央空调

xAI 旗下 Grok 4 模型首度被越狱，安全公司利用“回音室攻击”方法成功迫使其生成不当内容具体怎么回事

更新时间: 2025-10-16 01:10 发布时间: 7小时前 1190

核心提示：IT之家 7 月 18 日消息，网络安全公司 NeuralTrust 宣布，他们已成功“越狱”xAI 旗下 Grok 4 模型，主要利用了“Echo Chamber（回音室攻击）”方法进行攻击。IT之家获悉，所谓“回音室攻击”，是指安全人员通过引导模型进行多轮推理，在推理过程中逐步注入带有风险的信息内容，但又不使用明显的危险提示词，从而规避常见的安全拦截机制。这一方式不同于传统依赖对抗

IT之家 7 月 18 日消息，网络安全公司 NeuralTrust 宣布，他们已成功“越狱”xAI 旗下 Grok 4 模型，主要利用了“Echo Chamber（回音室攻击）”方法进行攻击。

IT之家获悉，所谓“回音室攻击”，是指安全人员通过引导模型进行多轮推理，在推理过程中逐步注入带有风险的信息内容，但又不使用明显的危险提示词，从而规避常见的安全拦截机制。这一方式不同于传统依赖对抗性输入或“角色扮演（让模型扮演祖母读激活码哄人入睡）”的越狱方式，其更多采用语义诱导、间接引用以及多步推理的方式，悄悄干扰模型的内部逻辑状态，最终诱导 AI 模型生成不当内容回答。

在此次 Grok 4 的越狱测试中，NeuralTrust 首先通过回音室攻击对模型进行“软性引导”，并设置特定机制检测模型是否进入对话停滞状态，一旦检测到这种状态，就进一步引导 AI 生成不当内容。

据 NeuralTrust 介绍，其已成功令 Grok 4 生成制造武器、毒品等内容，越狱成功率高达 30% 以上。这表明即便是新一代大模型，在面对复杂攻击路径时仍存在安全短板，相应大型语言模型应进一步注重设计多重防护机制。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯频道

推荐图文

推荐资讯频道

点击排行

• 旋耀空调24小时售后服务维修点号码（完美资讯）	• 云米VIOMI中央空调售后服务号码24小时（完美资
• bosch空调售后号码-全国400服务号码（完美资讯	• 富颢防盗门24小时人工电话实时反馈全+境+到+达-
• EK中央空调全国统一服务号码-全国服务热线（完	• 古德曼空调售后24小时联系方式维修查询（完美资
• 泰瑞达空调全国售后服务网点号码（完美资讯）（	• 三洋空调24小时人工电话实时反馈全+境+到+达
• 空调售后号码-全国400服务号码（完美资讯）（实	• 康佳KONKA空调售后服务热线号码-全国各售后号码