06.10.26 | 10:11 AM
媒介360AI日报2026.06.10 | Claude最强模型登场,谷歌实时翻译破壁,苹果端侧稀疏模型揭秘
Anthropic以两款“护栏区分”的Claude模型刷新性能天花板;谷歌推出实时语音互译模型,让跨语言对话近乎无感;苹果则详解其第三代端侧稀疏模型,在移动设备上实现高效推理。
BY 媒介360

2026年6月10日,AI领域迎来密集更新。Anthropic以两款“护栏区分”的Claude模型刷新性能天花板;谷歌推出实时语音互译模型,让跨语言对话近乎无感;苹果则详解其第三代端侧稀疏模型,在移动设备上实现高效推理。与此同时,滴滴、瑞幸、美团等玩家正将AI能力嵌入具体生活场景——从叫车到买咖啡再到浏览器Agent。微软AI负责人悄然修正了“18个月取代白领”的激进预言。


1. 最强Claude模型发布:Anthropic推出Fable 5/Mythos 5,书写AI神话

描述
6月9日,Anthropic发布Claude Fable 5与Claude Mythos 5。前者面向普通用户,定位公开可用能力最强的Claude模型,在软件工程、金融推理、图表理解等领域表现卓越,甚至能通过截图重建网页应用源码。后者通过Project Glasswing项目仅向网络安全与基础设施方开放,号称具备全球最强网络安全能力,并在药物设计中提速约10倍。两款模型底层相同,但针对不同场景设置了差异化安全护栏:Fable 5采用保守分类器拦截网安、生物化学等请求,命中后回退Opus 4.8;Mythos 5则放开护栏,专注于高敏感科研与防御任务。

创新看点
同一模型“软硬双版本”策略——通过可切换的护栏系统,让最强能力既能安全地服务大众,又能无约束地赋能顶尖防御者,开创了AI分级交付的新范式。


2. 谷歌发布实时语音互译模型Gemini 3.5 Live Translate:识别70余种语言,保留语调语速

描述
北京时间6月9日晚,谷歌正式推出Gemini 3.5 Live Translate,一款能自动识别70多种语言的实时语音互译模型。与传统轮流式翻译不同,它不会等说话者完整说完,而是连续生成语音,在“等待更多上下文以提升质量”和“即时跟上节奏”之间动态平衡。翻译音频流畅自然,保留原说话者的语调、语速和音高,整体延迟仅数秒。用户通过谷歌翻译App即可体验该功能,无需额外硬件。这标志着实时语音翻译从“逐句轮换”迈入“并行连续”阶段,极大降低了跨语言沟通的停顿尴尬。

创新看点
“永远慢几秒”的流畅感——模型学会了预测性生成,用极短延迟换取自然对话节奏,让机器翻译首次接近人类同传的语流体验。


3. 苹果详解第三代基础模型:端侧200亿参数稀疏模型采用“一次路由”机制

描述
在WWDC26后的技术交流中,苹果披露了第三代Apple Foundation Models。模型族包括两款端侧模型(AFM 3 Core、AFM 3 Core Advanced)及三款私有云模型。其中AFM 3 Core Advanced是一款200亿参数的稀疏模型,面向最强苹果芯片优化,原生支持语音合成、语音识别和视觉理解。苹果AI副总裁Amar Subramanya透露,该模型不采用逐词交换权重的传统方式,而是对整个提示做一次路由决策,将少量选中的FFN专家参数从NAND闪存加载到DRAM中计算,极大降低内存带宽需求。云端部分分工明确:AFM 3 Cloud处理日常请求,ADM 3 Cloud负责图像生成,AFM 3 Cloud Pro面向复杂推理与智能体任务。

创新看点
“一次路由,终身激活”——端侧稀疏模型的极致工程:将动态专家选择简化为提示级静态路由,让200亿参数能在移动设备上高效运行。


4. 滴滴率先接入微信AI生态:一句话叫车,全程不跳转

描述
随着微信正式开放AI生态接入能力,滴滴作为首批合作伙伴,已将核心网约车服务融入微信AI Agent。未来用户在微信中产生出行需求,只需说出“帮我叫一辆滴滴去机场”或“要特惠快车”,系统即可根据距离、时效和偏好自动推荐最优车型,一键唤起叫车服务,全程不跳转。从对话到上车,滴滴沉淀十年的出行能力被无缝嵌入微信对话流。滴滴顺风车、代驾等更多服务也将陆续接入。此举标志着超级App的AI入口开始实质性整合垂直服务,用户不再需要打开独立应用或反复跳转。

创新看点
“对话即交易”——微信AI Agent成为真正的服务调度中心,滴滴将运力网络隐入语义界面,出行从“手动下单”变成“随口一句话”。


5. 微软AI CEO苏莱曼改口:收回“AI 18个月内取代大部分白领工作”言论

描述
6月9日,微软AI部门CEO穆斯塔法·苏莱曼在一档播客中澄清其此前引发热议的预言。今年2月他曾表示,白领工作中大多数任务将在12-18个月内被AI完全自动化。如今他解释称,当时想表达的是AI将帮助白领完成重复性任务,如发邮件、做PPT、内部沟通,而非直接消灭岗位。“白领职位并不一定会消失,人们能借助工具更快、更高效地工作。”他补充道,技术发展的自然方向是让生活更轻松、减少摩擦。这一改口反映了业界从“替代焦虑”向“增强协同”的叙事转变,也侧面说明大规模职业替代的时间表远比想象中复杂。

创新看点
从“取代”到“增强”的语义滑移——与其说是技术判断修正,不如看作AI领导者对公众情绪和社会适应速度的一次再校准。


6. 美团AI浏览器Tabbit 1.0正式上线:聚合多模型,Agent能力嵌入毕业论文写作

描述
美团旗下GN06团队宣布AI原生浏览器Tabbit 1.0上线。从0.23版本迭代至今,Tabbit嵌入了更多Agent能力,内置多款头部大模型供用户调用。负责人刘炯强调标准版永久免费,每周提供约1000次模型对话、50张AI配图、10个Agent任务、100篇万字总结;专业版任务数为标准版10倍以上,售价一周9.9元(“一杯瑞幸”)。发布会上展示了一位大学毕业生使用Tabbit完成毕业论文的全流程:从方向细化、数据分析到答辩要点提炼,均由Agent参与。HR场景中,一句指令即可完成从简历筛选到PPT生成。Tabbit试图以浏览器为容器,将AI从“聊天框”推进到“工作流中枢”。

创新看点
“一杯瑞幸”的定价锚点——以极低价格将复杂Agent任务平民化,浏览器不再是网页容器,而成为可编程的生产力执行环境。


7. 小米MiMo推出UltraSpeed推理模式:单节点8卡GPU实现万亿参数MoE模型超1000 tokens/秒

描述
小米MiMo团队与AI编译优化系统组TileRT联合宣布推出MiMo-V2.5-Pro-UltraSpeed推理模式,专为1万亿参数混合专家(MoE)模型设计的高吞吐推理方案。据披露,该模式在单台标准8卡通用GPU节点上实现了每秒超过1000 tokens的生成速度。对于超大参数MoE模型而言,单节点吞吐直接影响推理成本、排队延迟和部署门槛。这一突破意味着万亿级别模型不再需要夸张的分布式集群,单台服务器即可支撑实时应用,大幅降低了超大模型的运营成本。

创新看点
“万亿参数,八卡突围”——通过系统级编译优化,将超大MoE的推理速度压榨到单节点极限,让企业用得起真正的巨模型。


8. 赛豆科技发布AI汽车品牌AIVA,携豆包大模型入局20万元以上市场

描述
赛豆科技昨日正式发布AI汽车品牌AIVA及概念车AIVA Origin Concept,首款量产车AIVA ME7将于年内亮相,全系覆盖20万元以上市场。AIVA由赛力斯、宁德时代等多方资本共同参与组建,火山引擎作为核心技术伙伴提供豆包大模型与智能座舱服务。概念车前大灯被设计为可交互、可表达情绪的“眼睛”,车顶搭载激光雷达。品牌发布同日,阿维塔发文暗指某品牌名称与设计“Ctrl+C Ctrl+V”,其法务部表示保留追责权利,评论区矛头直指AIVA。这场命名争议为新车发布增添了戏剧性。

创新看点
“汽车+大模型”的资本叙事——赛豆并非传统造车,而是以AI公司身份定义汽车,但首轮舆论战落在商标而非技术上,说明行业竞争已前移至符号层面。


9. 瑞幸上线CLI服务:开发者可在终端调用点单能力

描述
瑞幸咖啡AI开放平台官网显示,瑞幸已上线CLI(命令行界面)服务,开发者可通过macOS终端执行安装脚本后直接调用相关服务。该平台支持MCP、CLI、Skill多种接入方式,核心是将咖啡点单能力嵌入AI工具链。此前千问App开放第三方Agent和Skill时,瑞幸已被列为首批测试伙伴,用户可通过自然对话完成产品咨询、订单处理。CLI服务的上线进一步降低了开发者集成瑞幸能力的门槛,无论是构建自动化脚本还是接入AI Agent,都可像调用本地命令一样完成点单。

创新看点
“咖啡即服务”——把买咖啡抽象成命令行指令,让实体消费以极客方式融入DevOps和AI工作流,重新定义了即时零售的开放接口形态。


10. SpaceX受热捧:IPO吸引机构需求数倍于发售股份,纯做多基金抢筹

描述
据知情人士透露,SpaceX首次公开募股吸引到的机构投资者需求是供发售股份的数倍。牵头投行周二表示,与管理层会晤后需求进一步增长,认购订单持续增加,发行获得大幅超额认购。银行方面称,机构投资者部分将主要向大型纯做多投资管理公司倾斜。此前彭博报道,多家机构提交了约100亿美元或以上的认购订单。马斯克领导的这家火箭、卫星与人工智能公司的上市日益临近,市场热度可见一斑。尽管SpaceX的核心业务并非AI,但其星链数据、星舰智能化等AI相关布局同样为投资者所看重。

创新看点
“百亿美元认购门槛”——SpaceX的IPO热不仅源于航天光环,更暗含资本市场对“航天+AI”复合体未来垄断地位的提前定价。


结语
今天的AI日报呈现出两条清晰主线:一是基础模型的能力边界仍在急速外扩——Claude的双版本护栏策略、谷歌的实时同传、苹果的端侧稀疏推理,都在各自的维度上重新定义“可能”;二是AI正以服务形态渗透到日常的每一个缝隙——滴滴对话叫车、瑞幸命令行下单、美团浏览器完成毕业论文。微软苏莱曼的改口更像一个隐喻:与其担心AI取代人,不如关注它如何重塑人与工具的关系。当万亿元参数的模型能在单台服务器上跑出每秒上千token,当一杯咖啡的购买可以被终端命令触发,我们或许正站在“AI即基础设施”的真正门槛上。明天,还会有更多神话被书写,或者被修正。

advertisement