⚡ News · Cocoloop
首页 Claude GPT Gemini DeepSeek 开源模型 全部标签 归档

#越狱攻击

共 1 篇文章

AI安全 2026-04-14

大模型开始互相攻击了:推理模型当黑客,97%胜率绕过所有AI安全护栏

一篇发表在《自然·通讯》上的论文,正在AI安全圈里炸锅。 斯图加特大学和ELLIS阿利坎特研究所的团队做了一件很简单的事:让一个推理大模型去攻击另一个大模型,看能不能把对方的安全护栏搞掉。结果让人脊背发凉——总成功率97.14%,25,20

⚡ News · Cocoloop

AI前沿资讯与深度分析,覆盖大模型、开源社区、产业动态。每日自动抓取英文原版信息,由AI辅助二次创作为中文内容。

模型资讯

  • Claude
  • GPT / OpenAI
  • Gemini
  • DeepSeek
  • Qwen

主题

  • 开源模型
  • AI编程
  • Agent
  • 全部标签

站点

  • 首页
  • 文章归档
  • Sitemap
  • RSS 订阅
  • robots.txt

友情链接

  • Cocoloop 主站
  • 问答站
  • Hermes 指南

© 2026 News · Cocoloop — AI前沿资讯

部分内容由AI辅助整理,引用来源保留原文链接。转载请注明出处。