罗福莉自曝“Hunter Alpha”:不是DeepSeek V4,是她的作业

3月11日,代号为“Hunter Alpha”的神秘模型悄然上线全球最大API聚合平台OpenRouter。短短七天内,累计调用量突破1万亿Token,连续多日登顶榜单,一度被误认为是“DeepSeek V4”的早期版本。 如今谜底揭晓。 3月19日,小米正式发布新一代基础大模型体系,其中,“Hunter Alpha”正是其旗舰模型MiMo-V2-Pro的内部测试版本。这款模型不仅是小米在大模型领域的“新作业”,也被视为其全面押注智能体(Agent)时代的重要信号。 01 从“匿名爆款”到旗舰模型 OpenRouter 的大模型调用量排行榜(LLM Leaderboard) MiMo-V2-Pro是小米面向现实世界复杂任务打造的旗舰基座模型,其核心定位不再是“对话工具”,而是Agent系统的大脑——能够理解任务、调用工具、执行多步骤流程,并最终交付结果。 从架构上看,该模型总参数规模突破1万亿(1T),其中激活参数为42B,采用改进后的混合注意力机制(Hybrid Attention),在保证推理效率的同时大幅提升模型容量。其上下文窗口进一步扩展至10...

查看原文 →