本周 AI 新动态精选(2026.06.08–06.14)

🔥 本周 AI 新动态精选(2026.06.08–06.14)

  1. 🤖 月之暗面 — Kimi K2.7 Code(开源编程 LLM + 多模态)

• 核心能力:1T 参数 MoE 架构(激活 32B),原生支持 256K 上下文 + MoonViT 视觉编码器处理多模态输入;强制开启思维链推理,代码 Benchmark 提升 ~21.8%,推理 Token 消耗降 30%;API 同步上线,高速版推理提速 5–6×。

  1. ⚡ MiniMax — M3 开源原生多模态模型 + MSA 稀疏注意力

• 核心能力:约 428B 总参数 MoE(激活 23B),原生融合文本/图像/视频训练;自研 MiniMax Sparse Attention 使 1M 上下文推理加速 28 倍,预填加速 9×、解码加速 15×,长文本 Agent 门槛大幅降低;权重已开源。

  1. 🧠 智谱 — GLM-5.2 开源旗舰 + ZCode 3.0 Agent 编程工具

• 核心能力:744B MoE(激活 ~40B),真实可用 1M Token 长上下文,强化编程与复杂任务规划;配套 ZCode 3.0 切换自研 Agent 内核,支持分组任务工作区与智能知识库,MIT 协议开源免费商用。

  1. 🔧 小米 — MiMo Code V0.1(开源 Coding Agent)+ MiMo-V2.5 多模态模型

• 核心能力:终端级 AI 编程 Agent,内置持久记忆 + Compose 模式,支持跨会话上下文与零成本迁移 Claude Code 配置;内置 MiMo-V2.5 多模态模型,专项适配代码理解、工具调用与任务规划。

  1. 🌐 谷歌 — DiffusionGemma(开源扩散 LLM)+ Gemini-SQL2 API

• 核心能力:DiffusionGemma 26B MoE(激活 3.8B)采用并行扩散生成 256 Token,文本生成速度最高提 4×,适合代码补全与行内编辑;Gemini-SQL2(基于 Gemini 3.1 Pro)Text-to-SQL BIRD 基准准确率 80.04%,已开放 API 预览。

  1. 🎬 智源研究院 — Emu3.5 多模态统一基座 + 腾讯混元 HPC-Ops 推理算子库

• 核心能力:Emu3.5 纯自回归统一架构,原生支持文本/图像/视频理解与生成;腾讯混元开源 HPC-Ops 推理算子库——Attention 动态调度长文本加速 2.95×,端到端 QPM 提升 17%,FusedMoE 较主流框架快 1.2–1.6×。