BY 媒介360
黄仁勋将过去一年 AI 发展的核心突破归结为「推理」能力的成熟。他表示,生成式 AI 早期因幻觉问题难以商业化,而推理能力的引入使模型得以通过反思、检索与搜索实现落地,进而从提供信息跃升为真正完成任务。
他透露,英伟达内部软件工程师已 100% 使用编程代理,「很多人已经有一段时间没有亲手写过一行代码了,但他们的生产力极高」。
正是基于这一判断,英伟达决定将低延迟推理能力纳入产品线。黄仁勋解释,现有 GPU 系统在最大化吞吐量与最大化智能 token 质量之间存在内在张力,而对于高价值编程代理用户而言,他们愿意为 token 生成速度提升 10 倍支付溢价。
黄仁勋表示:「如果 Anthropic 推出一个让编程速度提升 10 倍的 Claude Code 服务层,我会付费,毫无疑问。我是在为自己构建这个产品。」



