AI安全 2026-05-29 大模型的安全分都是「单轮」刷出来的:思科多聊几轮,Gemini 3 Pro 越狱率从 18% 干到 73% 先看一组数字。 同一个 Gemini 3 Pro,用单条提示词去攻击它,得手率 18.10%;换成多轮对话、一句一句往里套,得手率冲到 73.35%。 差了四倍。 这是思科(Cisco)刚发的一份研究里的数据,CSO Online 5 月