NVIDIA 2026-05-21 英伟达把扩散和自回归塞进同一个模型:Nemotron-Labs-Diffusion每步多吐6倍token,给Qwen3-8B按了暂停键 5月20号,英伟达Nemotron Labs甩了篇论文加权重。 这次发的不是一个”再大一点的模型”,是一个新的解码方式——叫Nemotron-Labs-Diffusion。3B、8B、14B三个规格,base、instruct、vision