m360传赢 - 媒介360AI日报2026.07.01 | Claude Sonnet 5 正式上线寒武纪盘中市值突破 1 万亿元

BY 媒介360

算力军备竞赛进入新阶段，推理成本骤降与万亿美元市值同现。一边是巨头的技术突围，一边是泡沫隐忧下的资本狂飙——AI行业正站在效率革命与泡沫膨胀的十字路口。

1、DeepSeek 确认融资 74 亿美元，梁文锋个人出资 200 亿，称“AI 不应被少数人控制”

6 月 30 日，据 The Information 报道，梁文锋决定为 DeepSeek 启动融资的直接原因，是看到 Anthropic 的 Claude Mythos 通过海量算力和数据训练出超强能力，意识到若不储备资源将难以为继。本轮融资总额 74 亿美元，梁文锋本人出资约 200 亿人民币（约 30 亿美元），占总金额五分之二，为单笔最大出资。

融资完成后，DeepSeek 宣布全公司（约 300 人）各部门招聘规模“至少翻倍”，并设立员工持股计划。公司同时在加速适配华为芯片，但因训练部署体系原本围绕英伟达 CUDA 搭建，重写底层软件导致其 15 个月未发布新一代模型，错过了 Claude Code 带动的编程工具热潮。梁文锋表示，编程工具与聊天机器人均为 AI 进化中的临时产物，公司战略仍将坚持开源、低价与专注 AGI，并称“AI 不应该被少数人控制”。

创新看点：创始人个人出资 30 亿美元领投自身公司，这在全球 AI 融资史上绝无仅有——既是绝对控制权的宣示，也是把身家性命与公司命运彻底绑定的信号。

2、OpenAI 研发出推理成本减半方案，一度仅需数百 GPU 支撑无帐户用户访问

6 月 30 日，据 The Information 报道，一位知情人士透露，本月早些时候，OpenAI 工程师向部分同事表示，依托几项全新研发的优化技术，他们找到了一套方案，能将模型推理成本削减一半以上。工程师将这套新技术应用于没有免费或付费帐户的访客使用 ChatGPT 的场景后，一度把所需英伟达 GPU 数量压至仅数百个。

这一突破若规模化落地，将直接改写大模型运营的经济账——对 OpenAI 而言，这意味着用更少硬件支撑更大用户规模，毛利率有望显著提升；对行业而言，则预示着推理环节的算力门槛正在快速坍塌。

创新看点：“数百 GPU 支撑千万级访客”——若属实，这不仅是成本优化，更意味着边缘推理对算力集群的依赖被彻底打破，中小玩家入局门槛骤降。

3、寒武纪盘中市值突破 1 万亿元，成科创板首只万亿股

寒武纪昨日盘中涨幅一度扩大至逾 8%，股价报 1605.99 元，总市值突破 1 万亿元，成为科创板首只市值达到万亿级别的股票。截至 15:00 收盘，寒武纪股价报 1595.55 元，当日涨幅为 7.66%，总市值约 9160 亿元。

寒武纪的暴涨反映了资本市场对国产 AI 芯片前景的强烈看好，尤其是在中美科技博弈持续、国产替代逻辑不断强化的背景下。然而，其营收体量与市值之间的巨大落差，也让市场对估值的可持续性存有争议。

创新看点：万亿市值与百亿营收的落差，本质上是在定价“国产算力稀缺性”——市场押注的不是寒武纪的今天，而是中国 AI 芯片“不得不成”的战略未来。

4、月之暗面估值增至 315 亿美元，ARR 破 3 亿美元

6 月 30 日，从相关人士处获悉，月之暗面 Kimi 上一轮 200 亿美元估值融资于近日完成交割，新一轮融资已经启动，投前估值涨至 315 亿美元。截至 6 月中旬，月之暗面 ARR 突破 3 亿美元，这是继今年 3 月 ARR 突破 1 亿美元、5 月突破 2 亿美元后，Kimi 商业化进程的又一重要节点。

三个月内 ARR 从 1 亿到 3 亿美元，月之暗面用极短时间验证了其商业化路径的可行性。315 亿美元的投前估值，显示出资本市场对其增长潜力的高度认可。

创新看点：ARR 每两个月翻一倍，这种增速意味着 Kimi 在 To C 订阅和 To B 模型服务两端同时打开了付费水龙头——但 315 亿估值对应的是 AI“超级应用”的想象力，而非 SaaS 公司的估值逻辑。

5、SK 海力士正式启动赴美 IPO，HBM 全球市占率达 56.4%

SK 海力士昨日向美国证券交易委员会提交 F-1 招股说明书，正式启动赴美 IPO，计划在纳斯达克上市，股票代码为“SKHY”，发行形式为美国存托股份（ADS）。本次新发股份上限为 17,790,000 股，约占总股本的 2.50%，承销商为美银证券、花旗、高盛及摩根大通。

招股书显示，海力士今年第一季度营收为 52.576 万亿韩元（约合 345 亿美元），净利润为 40.346 万亿韩元（约合 265 亿美元），均较去年同期大幅增长。目前，海力士在 HBM 市场全球市占率达 56.4%，排名第一；在整体 DRAM 市场市占率为 29.1%，排名第二。

创新看点：HBM 是 AI 算力卡脖子的核心元器件，海力士赴美上市既是资本运作，更是地缘政治考量——在美股挂牌相当于给自己贴上一张“可信供应商”标签，以对冲供应链脱钩的风险。

6、Claude Sonnet 5 正式上线，要把 AI Agent 运行成本打下来

当地时间 6 月 30 日，Anthropic 发布新一代中型模型 Claude Sonnet 5，核心强化了 AI 智能体能力。官方表示，该模型在自主规划、浏览器及终端工具调用方面的表现，已达到此前大型昂贵模型的水平。性能方面，Sonnet 5 在编程基准测试中得分 63.2%，接近顶级模型 Opus 4，并显著优于前代 Sonnet 4。

早期合作伙伴反馈显示，该模型能自主完成更新 Salesforce 账户、发送公告等跨平台多步任务，且具备更强的自我检查能力。安全性上，新模型在拒绝恶意请求、降低幻觉率及抵御提示词注入方面均有提升。Sonnet 5 即日起成为免费版与 Pro 版的默认模型，初始定价为每百万输入 Token 2 美元、每百万输出 Token 10 美元（优惠至 8 月 31 日），后续将调整为 3 美元和 15 美元。

创新看点：Anthropic 正在打“智能体民主化”这张牌——用中等模型的成本提供顶级模型的 Agent 能力，瞄准的是开发者对 AI 执行多步任务“用得起、敢用起来”的刚需。

7、英伟达在华启动机器人人才招聘，聚焦具身智能等四大方向

6 月 30 日，据《每日经济新闻》从英伟达处获悉，全球 AI 芯片巨头英伟达近日在中国启动大规模机器人人才招聘计划，围绕具身智能、仿真、部署及解决方案架构四大核心方向开放多个岗位，覆盖北京、上海、深圳三地。其中，具身智能团队岗位数量最多，共开放 6 个职位，重点聚焦灵巧操作、配戴传感器的人体、全身移动操作以及全身控制等前沿技术方向。

英伟达在中国加码机器人研发，不仅是看中了中国完整的供应链和庞大的应用场景，更是意图在具身智能爆发前夜，抢占从芯片到算法再到系统集成的全栈生态位。

创新看点：英伟达不满足于卖 GPU 给机器人公司，而是要亲自定义“机器人操作系统”的标准——在中国落地研发团队，本质是深入到全球最丰富的机器人应用现场收集数据、迭代模型。

8、Arena 商业评测服务 AI Evaluations 年收入突破 1 亿美元

6 月 30 日，AI 模型评测平台 Arena 宣布，其企业级模型评测服务 AI Evaluations 上线仅 8 个月，年度经常性收入已突破 1 亿美元（约合 6.8 亿元人民币）。Arena 的前身是加州大学伯克利分校 2023 年启动的 LMArena 研究项目，以“免费”策略让用户比较模型输出优劣，据此构建排行榜，逐渐成为业内观察大模型能力的重要风向标。

2025 年 4 月 Arena 完成公司化运作，同年 9 月推出面向企业的商业产品“AI Evaluations”，利用真人反馈数据帮助客户评估模型在真实业务环境中的表现，号称能直观展示各模型的优势与短板，并提供可追溯的测试样本及 SLA，方便客户进行模型选型与优化迭代。

创新看点：用免费排行榜圈住流量和话语权，再向企业收“评测税”——Arena 证明了一件事：在模型能力趋同的时代，“谁更靠谱”的信息差本身就是一门大生意。

9、研究警告：把 AI 智能体叫做“员工”，会让人类犯更多错误

据 MIT Technology Review 报道，将 AI 智能体包装成“数字员工”的营销方式，可能正在系统性地削弱人类员工的判断力与责任感。波士顿大学商学院研究员 Emma Wiles 的研究发现，当 AI 工具被定义为“AI 员工”而非普通聊天机器人时，参与实验的管理者识别错误的能力下降了 18%，且有 44% 更倾向于将有问题的结果上报给上级，而非自行纠正。

参与研究的 1,261 名管理者中，已有近三分之一表示其所在公司将 AI 智能体定性为“员工”，甚至有 23% 将其列入组织架构图。MIT 经济学家、2024 年诺贝尔奖得主 Daron Acemoglu 也表示，当前 AI 智能体“被当作替代人类的工具来营销，这是一条走不通的路”，其应当被优化为增强人类能力的工具，而非替代品。

创新看点：一个心理学标签能系统性降低人类的判断力——“数字员工”这个叙事每多喊一声，人类的责任心就后退一步。在 AI 渗透关键领域之前，这个问题不是管理学议题，而是安全议题。

10、Cursor iOS 应用进入公测，移动端可启动云端 Agent

Cursor 官方社区公告显示，Cursor for iOS 已面向所有付费计划进入 public beta 阶段。用户可以从 iPhone 启动 always-on cloud agents，也可以远程控制在电脑上运行的 Agent。官方同时表示，移动端使用 Composer 2.5 可在 2026 年 7 月 5 日前享受 75% 折扣。

Cursor 将 AI 编程 Agent 能力延伸到移动端，意味着开发者可以在任何场景下发起编码任务、调度云端资源，进一步模糊了“开发环境”的物理边界。这一举措有望将 AI 编程助手的应用场景从桌面端大幅拓展至移动和远程办公场景。

创新看点:手机启动云端 Agent 的意义不在于“在手机上写代码”——而在于让 AI 编程从“工具调用”升级为“随时待命的异步协作者”，这是人机协作范式的真正跃迁。

这一天的AI世界呈现出某种微妙的分裂：一面是推理成本骤降、效率持续攀升的技术曲线，另一面是万亿市值与百亿营收并存的资本奇观。当梁文锋押上全部身家捍卫开源理想，当“数字员工”的叙事开始反噬人类的判断力，我们或许该停下来想一想：这场竞赛的终局，究竟是机器变得更像人，还是人变得更像机器？无论如何，AI行业正在以惊人的速度重塑一切——包括它自己。