06.03.26 | 12:12 PM
媒介360AI日报2026.06.03 | 微软Build 2026发布七款自研MAI模型 OpenAI现场演示无App手机
大模型正从“对话工具”走向“操作系统”和“基础设施”。
BY 媒介360

大模型正从“对话工具”走向“操作系统”和“基础设施”。微软一口气发布七款自研模型与AI原生设备,OpenAI用无App手机演示了智能体的终极形态,而英伟达、Anthropic、字节跳动则在各自赛道上加速卡位。以下是今日不可错过的10条重磅消息。


1. 微软Build 2026:发布七款自研MAI模型,推出“梦中神机”Surface RTX Spark Dev Box

微软在Build 2026开发者大会上集中发布了自研模型家族、本地AI开发设备及新型AI终端形态。推理模型MAI Thinking 1采用稀疏MoE架构(活跃参数35B,总参数约1T),支持256K上下文;代码模型MAI Code 1 Flash在SWE Bench Pro上得分51.2%,已向GitHub Copilot个人用户推出;图像、转录、语音模型同步更新。硬件方面,面向开发者的Surface RTX Spark Dev Box基于英伟达RTX Spark平台,提供1 petaflop AI算力、20个CPU核心和128GB统一内存,纳德拉称之为“dream machine”。此外,微软展示了代号Project Solara的两类参考设备:基于联发科芯片的桌面工作终端,以及采用高通可穿戴芯片的数字工牌。

创新看点
微软首次将“端侧实时生成界面”与“云端大模型推理”深度结合到操作系统底层,并用专用硬件将AI开发算力门槛拉低至100W功耗内,重新定义了PC作为“个人AI工位”的角色。

2. OpenAI现场演示无App手机:所有界面实时生成,推理甩给云端GPT

在OpenAI Voice Hack Night活动上,一支团队展示了为手机打造的“Agentic操作系统”原型。演示中手机不安装任何传统App,所有界面由端侧本地模型实时生成,重推理任务交由云端GPT处理。开发者全程通过语音指令完成预订机票、删除日历日程、查找AI新闻、发送邮件等操作。此前消息称,OpenAI正在加速推进AI智能体手机项目,计划2027年上半年量产。奥特曼曾多次暗示:“现在是认真重新思考操作系统和用户界面设计的合适时机。”

创新看点
“UI即系统”彻底颠覆了应用商店模式——界面随指令动态生成,用户不再受限于固定App功能,智能体成为真正的手机操作中心。

3. OpenAI与AWS合作正式落地:GPT-5.5、GPT-5.4与Codex上线Amazon Bedrock

AWS宣布,OpenAI GPT-5.5、GPT-5.4与Codex已在Amazon Bedrock正式可用。企业客户可在AWS现有安全、合规和治理工作流中直接调用。GPT-5.5现于美国东部俄亥俄区域上线;GPT-5.4覆盖俄亥俄和俄勒冈区域;Codex作为软件开发代码智能体进入Bedrock。OpenAI官方同步称,Daybreak也将进入AWS生态,用于安全代码审查、威胁建模、补丁验证及依赖风险分析。

创新看点
OpenAI与AWS的深度整合意味着企业无需迁移数据或改变合规流程即可调用最前沿模型,生成式AI正加速成为云平台的“内置能力”。

4. OpenAI扩展Codex生态:插件覆盖投行、数据分析等6大方向

OpenAI在“Intelligence at Work”直播活动中宣布,未来几周内将把Codex核心能力直接整合进ChatGPT,让用户直接调用其执行能力。同时推出角色专属插件、Sites共享网站功能及标注功能。目前Codex周活用户超500万,非开发者占比约20%,增速是开发者的3倍。角色插件首批上线6款,集成62款应用与110项技能,覆盖数据分析、创意生产、销售、产品设计、股权投资及投资银行等方向;Sites功能支持将分析结果生成可分享的交互式网页;标注功能扩展至文档、表格和幻灯片。

创新看点
Codex正从“编程助手”进化为“知识工作执行引擎”,非开发者增速远超开发者,AI智能体开始替代繁琐的跨应用操作。

5. 英伟达CEO黄仁勋:Vera CPU将比GPU更受欢迎,成为新主要增长动力

黄仁勋在台北Computex大会上表示,英伟达Vera CPU将在处理信息方面发挥关键作用,“Vera CPU将成为我们新的主要增长动力”。他同时承认芯片供应仍存在限制,但公司已为强劲增长确保了足够供应。Vera CPU的战略地位提升表明英伟达不再满足于GPU主导的AI计算,正系统性地构建CPU+GPU+网络的全栈优势。

创新看点
黄仁勋公开预测“CPU将比GPU更受欢迎”,释放了英伟达从AI加速器供应商向通用计算平台巨头转型的明确信号。

6. Anthropic:将向150家合作机构开放Mythos网络安全模型访问权限

Anthropic宣布扩大“玻璃之翼”项目,向15个国家/地区的150家合作机构开放Mythos网络安全模型访问权限,覆盖电力、水务、医疗保健、通信及硬件制造等领域。Anthropic曾于4月首次向50家机构开放,合作伙伴通过Mythos已发现1万个高危安全漏洞。官方表示:“我们的愿景是让AI提升所有软件的安全性,帮助整个行业适应AI对网络安全领域的改变。”

创新看点
Anthropic将网络安全模型从实验室推向关键基础设施领域,用AI主动发现漏洞而非被动防御,可能重塑安全攻防的底层逻辑。

7. 宇树科技回应与英伟达合作机器人:新产品“H2 Plus”下半年上市

英伟达CEO黄仁勋宣布与宇树科技联手推出新一代人形机器人参考设计“H2 Plus”,搭载英伟达高性能算力平台。宇树科技市场总监黄嘉玮透露该产品将于今年下半年正式上市,核心提升在于算力性能。英伟达Isaac GR00T平台将宇树H2 Plus人形机器人与Sharpa Wave触觉五指灵巧手整合到单一参考设计中,同时也将支持宇树G1人形机器人,预计很快在GitHub和Hugging Face公布。

创新看点
英伟达与宇树的合作标志着人形机器人进入“算力标准化”阶段,统一的开发平台将大幅降低机器人智能化的研发门槛。

8. 字节Seed机器人团队转向周畅汇报,加速整合具身智能资源

据《晚点 LatePost》报道,字节跳动Seed体系近期调整机器人团队汇报线:原由李航负责的Seed Robotics团队已向多模态负责人周畅汇报,李航以顾问身份负责学术合作。周畅2024年加入字节,主要负责多模态交互和世界模型方向。调整后机器人研发资源进一步集中,字节还在招聘具身智能技术负责人(L8级别,对标阿里P10-P11),向周畅汇报。报道指出,多模态交互、世界模型与Robotics技术高度相关,机器人场景也能为模型提供真实世界交互数据。

创新看点
字节将机器人研发从“多团队并行”整合为“模型驱动”单一汇报线,明确用世界模型和多模态能力反哺机器人理解物理世界的能力。

9. 腾讯云下调DeepSeek-V4系列模型价格,最高降幅97.5%

腾讯云发布公告,旗下智能体开发平台对DeepSeek-V4系列模型价格进行下调。DeepSeek-V4-Pro推理输入与输出价格均下调75%至每千tokens 0.003元、0.006元;缓存命中价格从每千tokens 0.001元降至0.000025元,降幅达97.5%。DeepSeek-V4-Flash缓存命中价格降幅为90%。此次降价大幅降低了开发者和企业调用大模型API的边际成本。

创新看点
缓存命中价格降至接近免费(0.000025元/千tokens),意味着高频重复查询的成本几乎可以忽略,将推动“常驻型AI智能体”的大规模部署。

10. 马斯克旗下xAI全球招募中文AI导师,时薪超300元可居家办公

xAI发布全球招聘启事,面向全球招募中文AI导师,支持远程办公,主要协助训练Grok的语音互动及多语言处理能力。美国本地时薪35-45美元(最高超300元人民币)。应聘者需母语级中文能力(能分辨口音、方言),英语B2以上,具备高水平的语音转录能力。语言学、语音科学背景或配音、广播、播客经验为加分项。

创新看点
xAI以高时薪和远程办公争夺高质量中文语音数据标注人才,反映出大模型竞争已从通用文本语料转向高门槛的方言与复杂音频理解。


结语

今天的关键词是“融合”。微软把模型、设备、操作系统揉成一个新物种;OpenAI让手机彻底告别App;英伟达悄悄把CPU抬到主角位置。AI不再是你对话的那个窗口,而正在成为整个数字世界的底层运行时。明天的开发者生态,或许将从写代码变成配置智能体。

advertisement