月之暗面新模型 “Kiwi-do” 现身,强大实力引发 AI 界轰动
2026年开年伊始,中国大模型赛道迎来一场震撼性“技术突袭”——在完成5亿美元(约35亿元人民币)C轮融资、账上现金突破百亿元人民币的重磅背景下,月之暗面(Moonshot)悄然释放一枚“战略级技术彩蛋”:代号 Kiwi-do 的全新多模态大模型,正式现身全球权威大模型竞技场 LmArena。它未发新闻稿、未开发布会,仅以一行简洁署名“Model by Moonshot”与一组惊艳基准测试成绩,瞬间点燃AI社区热议,被业内称为“2026年第一记AGI前哨信号”。
一、低调登场,高调破榜:Kiwi-do 的“静默式爆发”
不同于当前主流模型惯常的高调预热与参数轰炸,Kiwi-do 的亮相堪称“极简主义范本”:
- 在LmArena多模态榜单中,匿名提交、无额外说明,仅标注训练数据截止时间为2025年1月;
- 却在多项硬核评测中强势跻身Top-3,尤其在极具挑战性的 视觉物理推理测试(Visual Physical Commonsense Test, VPCT) 中,以 89.7% 准确率刷新历史纪录,大幅领先GPT-4o(76.2%)、Claude 3.5 Sonnet(78.5%)及国内竞品Qwen-VL-Max(82.1%);
- 在跨模态指令遵循(MM-Instruction Following)、长程视觉-语言因果链推理(VLCR)、动态场景三维心智建模(3D-MindSim)等原创评测子项中,均实现首次突破性得分,部分能力维度甚至呈现“断层式领先”。
值得注意的是,Kiwi-do 并未堆砌参数量或盲目扩大训练数据规模,其公开技术简报暗示:核心突破在于“物理世界表征引擎”的重构——通过引入新型时空连续体建模框架(Spacetime Continuum Encoder, SCE),将图像、视频、力觉模拟信号与文本描述统一映射至可微分物理语义空间,使模型真正具备“看懂物体如何运动、为何如此运动、下一步可能怎样运动”的底层推理能力。
二、35亿融资不是终点,而是“K3+Kiwi-do”双轨战略的起爆点
Kiwi-do 的横空出世,绝非孤立事件,而是月之暗面在2025年末完成C轮融资后,系统性技术升维计划的关键落子。
据杨植麟于2025年12月31日发布的内部信及后续多份权威信源(《晚点LatePost》《腾讯研究院AI速递》)交叉验证:
✅ 资金用途明确聚焦“算力基建+模型代际跃迁”:
- 100亿元现金储备中,超60%将用于“激进扩增显卡”——不仅采购H100/H200集群,更联合寒武纪、壁仞科技定制异构推理加速单元,构建面向K3与Kiwi-do协同训练的“物理感知专用算力底座”;
- K3大语言模型正进入最终冲刺阶段,目标是在2026年内实现等效FLOPs提升一个数量级(即≥10×现有水平),并在预训练质量上全面追平Gemma-3、Llama-4等国际前沿模型;
✅ Kiwi-do 与 K3 并非替代关系,而是“认知双螺旋”: - K3 负责高阶抽象、符号逻辑、长文本生成与Agent编排;
- Kiwi-do 则专注具身智能底层支撑——理解现实约束、模拟物理交互、生成可执行动作序列;
- 二者通过月之暗面自研的 Neuro-Symbolic Bridge(NSB)中间件 实现毫秒级语义对齐,为下一代“能看、会想、可动”的AI Agent提供原生多模态基座。
正如一位接近月之暗面的技术投资人所言:“他们不是在做一个‘更好的聊天机器人’,而是在建造一台‘数字世界的物理引擎’。”
三、不止于VPCT:Kiwi-do 暗示的三大范式转移
Kiwi-do 的惊艳表现,正在悄然改写行业对多模态AI能力边界的认知:
▪️ 从“识别”到“推演”:物理常识成为新基线
传统多模态模型擅长“What is it?”(这是什么?),而Kiwi-do已能稳定回答“What will happen if…?”(如果……会发生什么?)。例如:给定一张倾斜桌面上滚动的玻璃球照片+轻微风向提示,模型可准确预测球体轨迹、碰撞点、反弹角度及最终静止位置——这已超越感知,进入可计算的因果建模范畴。
▪️ 从“单帧理解”到“连续体建模”:时间不再是离散切片
Kiwi-do 在视频理解任务中采用隐式时空微分方程建模(Implicit Spatiotemporal ODE),将每段视频视为一个动态演化系统,而非帧序列拼接。这使其在慢动作重建、遮挡恢复、未来帧生成等任务中误差降低42%,为机器人视觉导航、工业缺陷预测等落地场景打开全新可能。
▪️ 从“通用多模态”到“垂直物理智能”:拒绝“大而全”,追求“专而深”
与多数厂商追求图文音视“全模态覆盖”不同,Kiwi-do 明确聚焦机械、材料、流体、电磁四类基础物理域,其训练数据中高达68%来自仿真引擎(如NVIDIA Omniverse、ANSYS Twin Builder)生成的高保真物理场景,辅以真实传感器数据闭环校准。这种“物理优先”路线,直指制造业、能源、航天等高价值垂类的智能化刚需。
四、余波与展望:多模态战局,真的要变天了?
Kiwi-do 的出现,恰逢中国大模型产业进入“冷静期”关键节点(据《2025一级市场回顾》,智谱、MiniMax正全力冲刺IPO,百川聚焦商业化闭环)。在此背景下,月之暗面以技术奇点式突破重设竞争标尺——
🔹 对行业而言:多模态能力评估正从“图文匹配准确率”加速转向“物理因果推理深度”与“具身行动可行性”;
🔹 对企业而言:单纯比拼参数、数据量、用户数的增长逻辑面临挑战,“模型-硬件-场景”垂直整合能力将成为新护城河;
🔹 对开发者而言:Kiwi-do 已开放有限API试用通道(通过Kimi App内测入口接入),其轻量化蒸馏版Kiwi-do-Lite将于Q1末开源,有望成为中文世界首个面向物理智能开发者的“可信赖多模态基座”。
当AGI的宏大叙事渐趋理性,月之暗面选择用Kiwi-do证明:通往通用智能的路径,或许不在云端无限膨胀的参数海洋,而在扎根现实世界的每一次精准推演、每一帧可信模拟、每一个可执行的动作承诺。
结语:这不是又一款“更强的大模型”,而是一次面向物理世界认知主权的郑重宣示。
Kiwi-do 已起飞——而它的目的地,是让AI真正“理解”我们所栖居的这个有重量、有摩擦、有因果律的真实宇宙。
本文信息综合自LmArena官方榜单、月之暗面内部信(2025.12.31)、《晚点LatePost》独家报道(2025.12.31)、腾讯研究院AI速递(2026.01.06)及一线技术社区实测反馈,截至2026年1月10日。