2026-06-29 AI 日报 · 叁笙早安 AI

今日头条 · 星期一模型发布

Grok 4.5 私测或超 Opus

马斯克通过内部私测 **Grok 4.5** 展现野心，月度迭代的训练节奏正将大模型算力竞争推向新极限。

埃隆·马斯克近日宣布，全新大模型 Grok 4.5 目前已在 SpaceX 和 Tesla 进入私有测试阶段。该模型基于 1.5T V9 基础模型，并在补充训练中加入了 Cursor 的数据，早期评估显示其性能已逼近甚至可能超越 Opus。

据悉，强化学习的持续引入正在显著改善该模型，同时 Grok Build 工具链也在逐日优化。更具行业震动性的是，马斯克表示 SpaceX 今年将开启极速迭代模式，计划每月都发布完全从零开始训练的全新模型。

💡 这标志着大模型研发已进入「以月为单位」从头训练的超高频迭代时代。马斯克利用旗下企业生态进行闭门实测与数据反哺，将极大加速其算力军备竞赛的步伐。

展开完整深度解读 · Grok 4.5 私测 SpaceX 和 Tesla，xAI 月月重训

导语

每月一款全新模型，这不是训练竞争，这是发射时间表。

事实

Grok 4.5 于 2026 年 6 月底进入 SpaceX 和 Tesla 内测，基于 1.5T 参数 V9 基础模型，补充了 Cursor 代码数据训练；更值得关注的是节奏：xAI 今年将每月从零重训全新模型，RL（强化学习）持续驱动，公开发布时间未定。

判断

有公开基准的 Grok 4.8（6 月初发布）已在 AIME 和 Codeforces 逼近 Claude Opus 4.8 与 GPT-5.5；而是节奏：每月重训 × 1.5T 规模意味着用算力换迭代速度。预计 2026 Q3 公开发布后。

启示

该信：xAI 每月重训的承诺若兑现，Grok 序列的迭代速度将超过所有同量级竞品 -- 这直接威胁 Anthropic 在高端推理市场的定价权。不该信：Musk 自曝自评一向乐观；两件事可以先做：一是盯 2026 Q3 发布时的第三方基准。

结语

月月重训。 ---

01 重点解读 4 篇

🔴 AI 芯片荒，苹果 Mac/iPad 全线涨价

行业动态

苹果全线涨价揭示了残酷现实：AI繁荣的巨额成本已不再局限于大厂军备竞赛，而是开始由普通消费者买单。

本周苹果宣布全线涨价。MacBook Neo涨$100（17%），MacBook Air涨$200（18%），入门iPad和iPad Air分别涨$100和$150，Apple TV暴涨54%。涨价主因是AI热潮导致内存芯片短缺，大厂疯狂采购NVIDIA GPU和高端存储挤占了供应链。微软随后也上调了Xbox价格。

主推端侧AI的苹果虽试图减少云端依赖，仍难逃行业成本压力。分析师Gurman指出，Apple Vision Pro逆势涨至$3,699，表明苹果宁愿牺牲销量也要死守利润率。这也意味着，AI繁荣的成本已切实转嫁到普通消费者身上。

💡 AI繁荣的代价正加速向终端传导。当科技巨头将供应链成本转嫁给用户，更贵的设备可能将部分普通消费者排除在新技术大门之外，科技行业的发展重心已从“让产品更便宜更好”转向了AI基建。

🟡 CEO-Bench：14 款 AI 仅 3 款盈利

研究突破

创业测试中多数AI惨遭破产，甚至不敌无AI的简单规则，暴露出智能体在长期战略决策上的致命短板。

普林斯顿大学推出 CEO-Bench 基准测试，让 AI 智能体在模拟环境中运营一家初始资金 100万美元 的公司 500天。在 14个 受测模型中，仅有 Claude Fable 5（4715万美元）、Claude Opus 4.8（2780万美元）和 GPT-5.5（2130万美元）在最佳运行中超过起始资金，其余多数模型在模拟结束前便宣告破产。

令人意外的是，一个完全不调用大语言模型的简单规则启发式方法，竟以 1576万美元 的成绩击败了除上述三款外的所有模型。这表明，当前的 agent 虽然擅长执行短期、窄任务，但在面对充满隐藏变量和滞后反馈的长期战略决策时，依然存在致命短板。

💡 这表明 agent 的评估标准正从“单任务效率”转向“长期战略规划”。未来做 agent 的团队必须重视模型在不确定性下的长链决策能力。

🟡 Coinbase 转投中国 AI，成本减半

行业动态

Coinbase等美企因性价比转向中国大模型，正对面临上市压力的西方头部实验室造成直接的定价冲击。

Coinbase 首席执行官 Brian Armstrong 宣布，公司已切换至 GLM 5.2 和 Kimi 2.7 等中国廉价模型。在 token 使用量创新高的同时，其 AI 支出却缩减了 50%。此外，Lindy 转向了 Deepseek v4，Snowflake 也在测试中国模型。这给正谋求 IPO、急需高增长数据支撑估值的西方 AI 实验室带来了巨大的定价压力。

为了极致控成本，Coinbase 部署了自动路由系统，将缓存命中率从 5% 提升至 60%。同时，公司要求员工的 AI 支出必须与实际产出的影响力挂钩，打破了硅谷盲目消耗 token 的风气。

💡 大模型行业的价格战已不可避免。随着企业级客户转向极致性价比，西方头部实验室必须在维持高估值与降价自保之间做出艰难抉择，这也将倒逼全球 AI 应用走向精细化运营。

🟡 DeepSpec：DeepSeek 开源解码全栈

工具产品

DeepSeek 开源投机采样全栈代码库 DeepSpec，为开发者提供从数据准备到模型评估的全流程工具。

deepseek-ai 发布了名为 DeepSpec 的全栈代码库，专门用于投机采样（speculative decoding）中草稿模型的训练与评估。该仓库功能完备，包含了数据准备工具、草稿模型实现、训练代码以及评估脚本。

此外，该项目还同步释放了相关的模型权重（Checkpoints）。这些权重均在 open-perfectb... 数据集上训练完成，正是其研究论文中 Table 1 所采用的测试模型，为开发者复现实验提供了便利。

💡 该全栈工具链的开源，使开发者能够闭环完成草稿模型的训练与评估，极大地简化了投机采样技术的研发流程并降低了复现门槛。

02 今日速览 5 条

🟡 独家：比亚迪璇玑 A3 芯片 2027 量产行业动态

据《晚点 Auto》报道，比亚迪计划明年在腾势品牌量产新车上首搭自研智驾芯片璇玑 A3。该芯片采用 4nm 工艺，单颗算力超 700 TOPS，支持 L3 和 L4 自动驾驶。随着自研芯片步入量产，比亚迪正加速推进智能化的垂直整合，力图在智能化“下半场”掌握更多自主权。

🟡 谷歌因算力不足，限制 Meta 用 Gemini 行业动态

据《金融时报》报道，Google 限制了 Meta 使用其 Gemini 模型，原因是 Google 无法提供 Meta 所需的庞大算力。这一限制凸显了当前算力资源的极度紧缺，即便是科技巨头之间，算力瓶颈也正在成为制约 AI 合作与技术落地的核心障碍。

🟢 高通边缘 AI 差异化，撕开英伟达缺口行业动态

高通在2026投资者日宣布激进转型，计划从移动业务转向AI数据中心。公司将2029财年非手机营收目标上调至400亿美元，推出自研服务器CPU Dragonfly C1000并获Meta订单，且拟以近40亿美元收购软件企业 Modular。此举意在通过软硬件布局打破英伟达的垄断，开辟手机之外的第二增长曲线。

🟢 智元第 15000 台人形机器人量产下线行业动态

6月28日，智元机器人宣布第 15000 台通用具身机器人精灵G2正式量产下线，公司合伙人姚卯青表示这标志着中国人形机器人迈入大规模真实场景应用。智元意在通过规模化量产在各行各业快速部署机器人，并在真实物理世界的交互中获取数据，利用数据飞轮使产品更智能、更稳定。

🟢 华为途灵：底盘从机械调校到算法控制工具产品

华为在技术专场详解了全新一代途灵平台（尊界 S800 搭载其 Ultra 版本途灵龙行平台）。该平台推动底盘从“机械调校”走向“数字控制”，通过三级缓存等优化算力，并建立高优先级通信链路，实现 2ms 级扭矩重分配与多域协同。这标志着智能汽车的竞争正从座舱和智驾延伸至底盘数字化，用算法重塑车辆的操控与安全。

扫描 47 个信源 · 精选 10 条