越狱攻击资讯与深度分析

收录越狱攻击相关 AI 新闻、产品动态和产业观察。本页收录 2 篇已发布文章。

先看一组数字。同一个 Gemini 3 Pro，用单条提示词去攻击它，得手率 18.10%；换成多轮对话、一句一句往里套，得手率冲到 73.35%。差了四倍。这是思科（Cisco）刚发的一份研究里的数据，CSO Online 5 月

一篇发表在《自然·通讯》上的论文，正在AI安全圈里炸锅。斯图加特大学和ELLIS阿利坎特研究所的团队做了一件很简单的事：让一个推理大模型去攻击另一个大模型，看能不能把对方的安全护栏搞掉。结果让人脊背发凉—— 总成功率97.14% ，25,

越狱攻击 资讯与深度分析