图片来源:界面新闻 3月19日,小米宣布推出三款自研大模型Xiaomi MiMo-V2-Pro、Xiaomi MiMo-V2-Omni与Xiaomi MiMo-V2-TTS。据悉,MiMo-V2-Pro、MiMo-V2-Omni已正式开放API服务。 据小米官方介绍,三款模型中,MiMo-V2-Pro 是旗舰文本基座,专为高强度 Agent 工作场景而生,主打推理、规划与工具调用。MiMo-V2-Omni 是全模态 Agent 基座,原生融合文本、视觉与音频感知,打通从理解到执行的完整链路。MiMo-V2-TTS 是语音合成大模型,目标是为 Agent 赋予有温度、有情感的声音表达能力,构成全栈的最后一环。 MiMo-V2-Pro作为旗舰基座模型,专为Agent场景深度优化,针对复杂多样的智能体架构进行了监督微调和强化学习,具备更强工具调用与多步推理能力,并最终交付结果。从架构上看,该模型总参数规模突破1万亿(1T),其中激活参数为42B,采用改进后的混合注意力机制(Hybrid At...
