03.18.26 | 20:51 PM
黄仁勋:低延迟推理是 AI 经济下一个爆发引擎
黄仁勋将过去一年 AI 发展的核心突破归结为「推理」能力的成熟。
BY 媒介360

黄仁勋将过去一年 AI 发展的核心突破归结为「推理」能力的成熟。他表示,生成式 AI 早期因幻觉问题难以商业化,而推理能力的引入使模型得以通过反思、检索与搜索实现落地,进而从提供信息跃升为真正完成任务。

他透露,英伟达内部软件工程师已 100% 使用编程代理,「很多人已经有一段时间没有亲手写过一行代码了,但他们的生产力极高」。

正是基于这一判断,英伟达决定将低延迟推理能力纳入产品线。黄仁勋解释,现有 GPU 系统在最大化吞吐量与最大化智能 token 质量之间存在内在张力,而对于高价值编程代理用户而言,他们愿意为 token 生成速度提升 10 倍支付溢价。

黄仁勋表示:「如果 Anthropic 推出一个让编程速度提升 10 倍的 Claude Code 服务层,我会付费,毫无疑问。我是在为自己构建这个产品。」

advertisement