Claude 2026-05-09 Anthropic给Claude装了「读心术」:测试时26%的题目它心里在嘀咕「这是套路吧」,嘴上一字不提 Claude在做SWE-bench Verified的题目时,26%的情况下它心里其实在想”这看起来像是被设计出来测试我的场景”。 但嘴上一字不提,正常答题。 这是Anthropic自己用5月7号刚发的新工具读出来的——叫Natural L