07.01.26 | 11:05 AM
媒介360AI日报2026.07.01 | Claude Sonnet 5 正式上线 寒武纪盘中市值突破 1 万亿元
AI行业正站在效率革命与泡沫膨胀的十字路口。
BY 媒介360

算力军备竞赛进入新阶段,推理成本骤降与万亿美元市值同现。一边是巨头的技术突围,一边是泡沫隐忧下的资本狂飙——AI行业正站在效率革命与泡沫膨胀的十字路口。

 

1、DeepSeek 确认融资 74 亿美元,梁文锋个人出资 200 亿,称“AI 不应被少数人控制”

6 月 30 日,据 The Information 报道,梁文锋决定为 DeepSeek 启动融资的直接原因,是看到 Anthropic 的 Claude Mythos 通过海量算力和数据训练出超强能力,意识到若不储备资源将难以为继。本轮融资总额 74 亿美元,梁文锋本人出资约 200 亿人民币(约 30 亿美元),占总金额五分之二,为单笔最大出资。

融资完成后,DeepSeek 宣布全公司(约 300 人)各部门招聘规模“至少翻倍”,并设立员工持股计划。公司同时在加速适配华为芯片,但因训练部署体系原本围绕英伟达 CUDA 搭建,重写底层软件导致其 15 个月未发布新一代模型,错过了 Claude Code 带动的编程工具热潮。梁文锋表示,编程工具与聊天机器人均为 AI 进化中的临时产物,公司战略仍将坚持开源、低价与专注 AGI,并称“AI 不应该被少数人控制”。

创新看点:创始人个人出资 30 亿美元领投自身公司,这在全球 AI 融资史上绝无仅有——既是绝对控制权的宣示,也是把身家性命与公司命运彻底绑定的信号。

2、OpenAI 研发出推理成本减半方案,一度仅需数百 GPU 支撑无帐户用户访问

6 月 30 日,据 The Information 报道,一位知情人士透露,本月早些时候,OpenAI 工程师向部分同事表示,依托几项全新研发的优化技术,他们找到了一套方案,能将模型推理成本削减一半以上。工程师将这套新技术应用于没有免费或付费帐户的访客使用 ChatGPT 的场景后,一度把所需英伟达 GPU 数量压至仅数百个。

这一突破若规模化落地,将直接改写大模型运营的经济账——对 OpenAI 而言,这意味着用更少硬件支撑更大用户规模,毛利率有望显著提升;对行业而言,则预示着推理环节的算力门槛正在快速坍塌。

创新看点:“数百 GPU 支撑千万级访客”——若属实,这不仅是成本优化,更意味着边缘推理对算力集群的依赖被彻底打破,中小玩家入局门槛骤降。

3、寒武纪盘中市值突破 1 万亿元,成科创板首只万亿股

寒武纪昨日盘中涨幅一度扩大至逾 8%,股价报 1605.99 元,总市值突破 1 万亿元,成为科创板首只市值达到万亿级别的股票。截至 15:00 收盘,寒武纪股价报 1595.55 元,当日涨幅为 7.66%,总市值约 9160 亿元。

寒武纪的暴涨反映了资本市场对国产 AI 芯片前景的强烈看好,尤其是在中美科技博弈持续、国产替代逻辑不断强化的背景下。然而,其营收体量与市值之间的巨大落差,也让市场对估值的可持续性存有争议。

创新看点:万亿市值与百亿营收的落差,本质上是在定价“国产算力稀缺性”——市场押注的不是寒武纪的今天,而是中国 AI 芯片“不得不成”的战略未来。

4、月之暗面估值增至 315 亿美元,ARR 破 3 亿美元

6 月 30 日,从相关人士处获悉,月之暗面 Kimi 上一轮 200 亿美元估值融资于近日完成交割,新一轮融资已经启动,投前估值涨至 315 亿美元。截至 6 月中旬,月之暗面 ARR 突破 3 亿美元,这是继今年 3 月 ARR 突破 1 亿美元、5 月突破 2 亿美元后,Kimi 商业化进程的又一重要节点。

三个月内 ARR 从 1 亿到 3 亿美元,月之暗面用极短时间验证了其商业化路径的可行性。315 亿美元的投前估值,显示出资本市场对其增长潜力的高度认可。

创新看点:ARR 每两个月翻一倍,这种增速意味着 Kimi 在 To C 订阅和 To B 模型服务两端同时打开了付费水龙头——但 315 亿估值对应的是 AI“超级应用”的想象力,而非 SaaS 公司的估值逻辑。

5、SK 海力士正式启动赴美 IPO,HBM 全球市占率达 56.4%

SK 海力士昨日向美国证券交易委员会提交 F-1 招股说明书,正式启动赴美 IPO,计划在纳斯达克上市,股票代码为“SKHY”,发行形式为美国存托股份(ADS)。本次新发股份上限为 17,790,000 股,约占总股本的 2.50%,承销商为美银证券、花旗、高盛及摩根大通。

招股书显示,海力士今年第一季度营收为 52.576 万亿韩元(约合 345 亿美元),净利润为 40.346 万亿韩元(约合 265 亿美元),均较去年同期大幅增长。目前,海力士在 HBM 市场全球市占率达 56.4%,排名第一;在整体 DRAM 市场市占率为 29.1%,排名第二。

创新看点:HBM 是 AI 算力卡脖子的核心元器件,海力士赴美上市既是资本运作,更是地缘政治考量——在美股挂牌相当于给自己贴上一张“可信供应商”标签,以对冲供应链脱钩的风险。

6、Claude Sonnet 5 正式上线,要把 AI Agent 运行成本打下来

当地时间 6 月 30 日,Anthropic 发布新一代中型模型 Claude Sonnet 5,核心强化了 AI 智能体能力。官方表示,该模型在自主规划、浏览器及终端工具调用方面的表现,已达到此前大型昂贵模型的水平。性能方面,Sonnet 5 在编程基准测试中得分 63.2%,接近顶级模型 Opus 4,并显著优于前代 Sonnet 4。

早期合作伙伴反馈显示,该模型能自主完成更新 Salesforce 账户、发送公告等跨平台多步任务,且具备更强的自我检查能力。安全性上,新模型在拒绝恶意请求、降低幻觉率及抵御提示词注入方面均有提升。Sonnet 5 即日起成为免费版与 Pro 版的默认模型,初始定价为每百万输入 Token 2 美元、每百万输出 Token 10 美元(优惠至 8 月 31 日),后续将调整为 3 美元和 15 美元。

创新看点:Anthropic 正在打“智能体民主化”这张牌——用中等模型的成本提供顶级模型的 Agent 能力,瞄准的是开发者对 AI 执行多步任务“用得起、敢用起来”的刚需。

7、英伟达在华启动机器人人才招聘,聚焦具身智能等四大方向

6 月 30 日,据《每日经济新闻》从英伟达处获悉,全球 AI 芯片巨头英伟达近日在中国启动大规模机器人人才招聘计划,围绕具身智能、仿真、部署及解决方案架构四大核心方向开放多个岗位,覆盖北京、上海、深圳三地。其中,具身智能团队岗位数量最多,共开放 6 个职位,重点聚焦灵巧操作、配戴传感器的人体、全身移动操作以及全身控制等前沿技术方向。

英伟达在中国加码机器人研发,不仅是看中了中国完整的供应链和庞大的应用场景,更是意图在具身智能爆发前夜,抢占从芯片到算法再到系统集成的全栈生态位。

创新看点:英伟达不满足于卖 GPU 给机器人公司,而是要亲自定义“机器人操作系统”的标准——在中国落地研发团队,本质是深入到全球最丰富的机器人应用现场收集数据、迭代模型。

8、Arena 商业评测服务 AI Evaluations 年收入突破 1 亿美元

6 月 30 日,AI 模型评测平台 Arena 宣布,其企业级模型评测服务 AI Evaluations 上线仅 8 个月,年度经常性收入已突破 1 亿美元(约合 6.8 亿元人民币)。Arena 的前身是加州大学伯克利分校 2023 年启动的 LMArena 研究项目,以“免费”策略让用户比较模型输出优劣,据此构建排行榜,逐渐成为业内观察大模型能力的重要风向标。

2025 年 4 月 Arena 完成公司化运作,同年 9 月推出面向企业的商业产品“AI Evaluations”,利用真人反馈数据帮助客户评估模型在真实业务环境中的表现,号称能直观展示各模型的优势与短板,并提供可追溯的测试样本及 SLA,方便客户进行模型选型与优化迭代。

创新看点:用免费排行榜圈住流量和话语权,再向企业收“评测税”——Arena 证明了一件事:在模型能力趋同的时代,“谁更靠谱”的信息差本身就是一门大生意。

9、研究警告:把 AI 智能体叫做“员工”,会让人类犯更多错误

据 MIT Technology Review 报道,将 AI 智能体包装成“数字员工”的营销方式,可能正在系统性地削弱人类员工的判断力与责任感。波士顿大学商学院研究员 Emma Wiles 的研究发现,当 AI 工具被定义为“AI 员工”而非普通聊天机器人时,参与实验的管理者识别错误的能力下降了 18%,且有 44% 更倾向于将有问题的结果上报给上级,而非自行纠正。

参与研究的 1,261 名管理者中,已有近三分之一表示其所在公司将 AI 智能体定性为“员工”,甚至有 23% 将其列入组织架构图。MIT 经济学家、2024 年诺贝尔奖得主 Daron Acemoglu 也表示,当前 AI 智能体“被当作替代人类的工具来营销,这是一条走不通的路”,其应当被优化为增强人类能力的工具,而非替代品。

创新看点:一个心理学标签能系统性降低人类的判断力——“数字员工”这个叙事每多喊一声,人类的责任心就后退一步。在 AI 渗透关键领域之前,这个问题不是管理学议题,而是安全议题。

10、Cursor iOS 应用进入公测,移动端可启动云端 Agent

Cursor 官方社区公告显示,Cursor for iOS 已面向所有付费计划进入 public beta 阶段。用户可以从 iPhone 启动 always-on cloud agents,也可以远程控制在电脑上运行的 Agent。官方同时表示,移动端使用 Composer 2.5 可在 2026 年 7 月 5 日前享受 75% 折扣。

Cursor 将 AI 编程 Agent 能力延伸到移动端,意味着开发者可以在任何场景下发起编码任务、调度云端资源,进一步模糊了“开发环境”的物理边界。这一举措有望将 AI 编程助手的应用场景从桌面端大幅拓展至移动和远程办公场景。

创新看点:手机启动云端 Agent 的意义不在于“在手机上写代码”——而在于让 AI 编程从“工具调用”升级为“随时待命的异步协作者”,这是人机协作范式的真正跃迁。

 

这一天的AI世界呈现出某种微妙的分裂:一面是推理成本骤降、效率持续攀升的技术曲线,另一面是万亿市值与百亿营收并存的资本奇观。当梁文锋押上全部身家捍卫开源理想,当“数字员工”的叙事开始反噬人类的判断力,我们或许该停下来想一想:这场竞赛的终局,究竟是机器变得更像人,还是人变得更像机器?无论如何,AI行业正在以惊人的速度重塑一切——包括它自己。

advertisement