Google 2026-04-13 Gemini 3.1 Pro:18项测试拿了12个第一,ARC-AGI-2跑出77.1%,推理能力翻倍 二月底,Google DeepMind发布了Gemini 3.1 Pro。发布后有一个数字在开发者社区传得比较广:在目前追踪的18个主要benchmark里,3.1 Pro拿了12个第一。 更值得关注的是ARC-AGI-2——这个测试专门设