摘要
豪华创业组合,陈天桥与代季峰因梁文锋牵线联合创办MiroMind,剑指“下一个DeepSeek”。
放弃传统Scaling Law,用“交互式推理闭环+证据驱动训练+时间敏感沙箱”把模型训练成会自主检索、纠错的研究员,而非记忆容器。
低成本+高推理速度使Agent可大规模端侧落地,手机、眼镜、穿戴等AI硬件将迎来“电池式”普及,重塑交互与功能设计。
2026年AI竞争主线从“拼参数”转向“拼智力”,小模型或成AGI另一条主干道,推动AI真正走出数据中心、进入日常生活。
如果说 2025 年 DeepSeek 的爆发让全球意识到算力并非通往 AGI 的唯一方式,那么 2026 年开年,MiroThinker 1.5 的发布,让人更关注小模型的潜力所在。
MiroThinker 1.5 是盛大集团创始人陈天桥与 AI 科学家代季峰创办的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通过 其 30B 小模型规格,通过极小的算力调度,在复杂推理任务中取得了不输大模型的表现,同时响应速度更快、成本更低、智能表现效果更好。目前,MiroThinker 1.5 正处于公开发布阶段,人人皆可上手免费使用。
除了 MiroThinker 1.5 性能表现优越以外,MiroThinker 备受关注的另一大原因是,这是一个强强联手打造出来的创业项目。
MiroMind 是陈天桥在 AI 领域,少有的,自己下场主导并参与的创业项目,他曾凭借《传奇》缔造网游神话、登顶中国首富。在淡出中心视野这些年里,他扎进脑科学领域,砸下十亿美金建立 TCCI,试图挖掘人类大脑的秘密。
公司的另一个创始人则是代季峰,从微软亚洲研究院到商汤科技,一直扎根在计算机视觉领域。他主导过 InternVL 等开源项目,是物体检测与具身智能领域的风云人物。两者组合,让 MiroThinker 1.5 哪怕只是刚上线不久,也得到业内不少关注。
图片来源: MiroMind 官网
不过,如果小模型的性能真的能够与大模型相媲美,Agent 或许将会迎来一轮落地爆发,随着 Agent 真正完成端侧落地,AI 硬件的能力与玩法,或许也会迎来新一轮的变革。
01
就在前不久,MiroMind 首席科学家代季峰在知乎上亲自下场,还原了这段颇有江湖色彩的创业故事。
出人意料的是,为 MiroMind 两位核心人物牵线搭桥的正是 DeepSeek 的掌门人梁文锋。
2025 年初,当陈天桥目睹了 DeepSeek 能力后,就意识到通往 AGI 的道路已开始明晰。当发现自己完全有能力打造下一个 DeepSeek 时,他询问梁文锋,谁最适合带队冲刺 AGI?梁文锋当时就推荐了代季峰,陈天桥没有任何迟疑,直接锁定了他,两人联合创办了 MiroMind。
据代季峰回忆道,在创业前最关键的那场谈话中,没有冗长的商务谈判,只有相见恨晚的共鸣。
当时,陈天桥问代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因为梁文锋一人集齐了「有钱、有理想、懂技术」三个要素,沟通与管理的成本降到极限。代老师随后坦诚相待说:「我有理想和技术,但唯独少了点『资金』。」陈天桥对此相视一笑提到,「我有资本,有对 AGI 的执着理想,但确实缺一位懂技术的领路人。」
这种各有所长的组合,补齐了他们通往 AGI 创业道路的最后一块拼图。代季峰在组建团队时,带有一种近乎纯粹的「少年感」,他提到自己不需要那种在大厂下午发消息、深夜十点才带着满身疲惫回家的员工,而是更希望团队伙伴们都能做到「眼里有光」的状态。
图片来源:清华大学官网
在选择究竟以什么方向切入赛道时,代季峰很清醒地意识到,现在 LLM 预训练的曲线已经走到了极其平缓的平台期,作为一个后来者,选择再去大模型赛道拼参数并没有意义。
于是,MiroMind 毅然选择杀入了刚兴起的 Agent Modeling 赛道,他们想看看,如果不再推崇算力至上,而是追求最懂、最实用的模型,能不能在 Agent 时代跑出一条不一样的生路。
02
过去七个月,MiroMind 一直在思考一个更为根本的问题:智能的「奇点」究竟在哪里?
最后他们给出的的答案并非是「用参数推出世界记忆模型」,而是追求「发现智能」。
他们在官网中写道:真正的智能并非依赖于全知全能,而是依赖于研究、验证和纠正的能力。因为真正的智能不是过目不忘的死记硬背,而是像科学家一样,在不确定性中通过纠错抵达真相。
MiroThinker 1.5 测试的最终的效果,也非常令人欣喜。面对万亿级参数的 Kimi-K2-Thinking,仅有 30B 参数规模的 MiroThinker-v1.5 表现出了相当的推理水平。而最直观的表现是模型性能与模型成本成倒挂的态势,在衡量搜索代理能力的基准测试 BrowseComp-ZH 中,30B 版本的表现位列全球前列。
BrowseComp 基准测试的性能比较 |图片来源:MiroMind 官网
由于参数量缩减到对方的 1/30,MiroThinker 1.5 30B 调用成本大幅下降至每次 0.07 美元,仅为万亿模型成本的 1/20,且推理速度更快。
智能搜索基准测试的性能比较|图片来源:MiroMind 官网
MiroMind 在官网解释了自己的设计思路与原理。他们认为传统的 Scaling Law 路径倾向于将尽可能多的人类知识记忆在模型参数中。这种做法的弊端在于,当模型面对未知领域或实时变动的信息时,往往会基于统计概率「捏造」答案,从而产生幻觉。而 MiroMind 团队则将技术重点放在了交互式缩放(Interactive Scaling)上。
具体而言,在技术实现上,MiroThinker 1.5 引入了几个核心的新机制:
-
交互式推理闭环: 模型不再进行简单的线性思维链(CoT)外推。它构建了一个「提出假设—查询外部数据—发现冲突—修正假设」的研究循环。在得出结论前,模型会主动发起多轮外部检索,利用确定性的外部证据流来抵御不确定的内部推理偏差。
-
证据驱动的训练机制: 在训练阶段,团队改变了奖励函数。系统不再单纯奖励答案的正确性,而是强化模型搜寻证据的行为。缺乏来源支持的高置信度输出会被惩罚,这迫使模型形成一种「先验证、后判断」的本能。
-
时间敏感型训练沙箱: 为了解决 AI 的「后见之明」问题,标准训练中,模型通常能看到数据的最终结果,这使其在预测未来时倾向于先「回忆过去」。简单来说,MiroMind 构建了一个沙箱,严格限制模型只能访问特定时间戳之前的信息,迫使它在信息不完整、存在延迟的真实环境下学习推理和纠错。
如此一来,MiroThinker 1.5 不再是一个试图记住所有百科知识的容器,而是一个擅长使用工具的专业研究员。在处理金融分析、时效性预测等任务时,它能够展示完整的逻辑验证链条。
演示提问:下周有哪些重大事件可能会影响美国纳斯达克指数?|图片来源:MiroMind 官网
03
MiroThinker 1.5 的出现,在行业内引发了一定反响。不少业内人士认为,AI 竞争即将从拼参数拼规模的时代,转向「拼智力」的时代。
随着模型参数规模的持续下降和推理成本的边际递减,2026 年小模型或成为关键。当 AI 模型的参数规模最够小、价格最够低,且表现性能足够好时,能够更高效地集成进各类移动终端和边缘设备中,那么 AI 落地硬件的算力门槛问题将会迎刃而解。那些已经在大厂实验室、初创公司里打磨了一两年的 AI 硬件,才算真正具备了底层技术支撑,迎来了真正的「开智」时刻,且能够进一步迎接更丰富的功能,更有趣的交互设计。
就如同电力时代刚开启时,人类必须依赖庞大的变压器和错综复杂的电网供电,那时的电力是昂贵且固定的。但当电池技术成熟、电力变得可随身携带后,电器才真正爆发并改变了每一个人的生活。如今的大模型就像初期的电网中心,而 MiroThinker 1.5 这样的小模型,则更像随处可见的「电池」。
可以预见的是,2026 年,AI 变革将不再仅仅局限于行业内部的技术狂欢,而是会通过手机、眼镜、穿戴设备等每一个真实的硬件入口,触达每一个普通人。当 AI 能够以极低的成本在端侧实时运行、自主研究并解决问题时,所有人都会比以往任何时候,都更直观地感受到 AI 时代对生活的影响。
本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/71472.html


微信扫一扫
支付宝扫一扫






























