欧洲 AI 公司的故事,通常到发布模型就结束了。
Mistral 在 2026 年 4 月底连发了三件事:Workflows 编排引擎进入公开预览、128B 旗舰模型 Medium 3.5 开放 API、Le Chat 新增 Work 智能体模式。单看任何一件都不算颠覆性,但三件事摆在一起,你才能看清楚这家法国公司想要什么。
这不是又一轮"我们出了个更好的模型"。Mistral 在用一种不一样的方式,从模型往上一层一层地搭。
Workflows 是什么:Temporal 驱动的生产级编排引擎
2026 年 4 月 28 日,Mistral 在 Mistral Studio 里上线了 Workflows 公开预览版,面向企业自动化团队。
官方定位很清楚:用来定义、执行和监控多步骤 AI 流程的结构化系统。从简单的顺序任务,到复杂的有状态操作,从纯确定性的业务规则,到 LLM 的概率输出,都可以在同一个编排层里跑。
底层基础设施是 Temporal 的 durable execution engine。这套东西 Netflix、Stripe、Salesforce 都在用,算是分布式编排领域的事实标准。Mistral 在上面加了几层 AI 专用扩展:流式输出处理、大 payload 管理、多租户隔离、可观测性。不是自己从头造,而是站在已经经过生产验证的基础上往上加。
上线时,Workflows 就已经在运行每日数百万次的执行量。这个数字不是营销数字,是他们在内部自己用了足够长时间之后才对外开放的结果,据 VentureBeat 报道如此。
架构设计:控制面和数据面分离
这是 Workflows 最值得关注的架构决策。
编排控制面跑在 Mistral 托管的基础设施上,但执行 worker 和数据处理留在客户自己的环境里,不管是公有云、本地机房,还是混合部署都行。两个面各司其职,不强行绑在一起。
对企业来说,这意味着数据不出境,编排逻辑归 Mistral 管。合规压力大的行业,这个架构设计基本上是准入门槛,不需要客户再签一堆数据处理补充协议。ASML、法国邮政银行(La Banque Postale)、法国劳工局(France Travail)、航运集团 CMA-CGM 已经在用了。这些机构的数据合规要求,出了欧洲的公司很难满足。
开发体验:Python 写,Le Chat 触发
开发者用 Python 写 workflow,部署之后可以直接发布到 Le Chat,让组织里任何人都能触发它,不需要懂代码。典型的编排结构大概长这样:
from mistral.workflows import workflow, step
@workflow
def document_review_pipeline(document_url: str):
# 顺序执行,每步有独立的重试策略和超时配置
extracted = step(extract_content, document_url)
summary = step(summarize, extracted, model="mistral-medium-3.5")
# human-in-the-loop 作为一等公民
approval = step(request_human_approval, summary)
if approval.approved:
return step(publish, summary)
return step(archive, summary)
重试策略、链路追踪、超时设置、限流,都可以通过 decorator 和单行配置完成,不需要在业务逻辑里手写这些防御性代码。
Workflows 把 human-in-the-loop 做成了原生特性,而不是事后加的补丁。一个 workflow 可以暂停,等人审批,然后从同一个断点继续,整个等待过程不消耗计算资源。这在传统编排工具里需要自己写状态机来实现。
Mistral Medium 3.5:128B 模型的定价逻辑
Medium 3.5 在 Workflows 上线一天后发布,也就是 2026 年 4 月 29 日。
参数量 128B,上下文窗口 256K,支持可配置推理,原生多模态输入。这是 Mistral 目前开放权重里规格最高的模型。定价方面,API 输入 $1.50 每百万 tokens。
这个价格放在当前市场上是什么位置,往上比旗舰闭源模型便宜一个数量级,往下比 Mistral 自家的小模型贵。它瞄准的是"效果够用,预算可控"的企业生产场景,不是做最强,是做最合适。
跑分:SWE-Bench 77.6%,MMLU 没公布
这里需要说一个不太好看的实情。
Medium 3.5 的 MMLU、HumanEval、MATH 跑分,Mistral 目前没有公布。他们选择发布的是 SWE-Bench Verified 77.6%,编程任务上接近但没有超过 Claude Sonnet 4.6,数据来自 MarkTechPost 对 Mistral 官方发布材料的整理。
对于一家把"开放"当成核心叙事的公司,缺少主流 benchmark 数据是个明显的信息缺口。你在做技术选型时,这一点要算进去。
参考系可以用 Mistral Large 3:在 MMLU 8 语言评测上大约 85.5%,HumanEval pass@1 约 92%。那是更大的模型,但可以给你一个上限感知。
| 指标 | Mistral Medium 3.5 | 备注 |
|---|---|---|
| 参数量 | 128B | 开放权重 |
| 上下文窗口 | 256K tokens | 长文档处理友好 |
| 推理模式 | 可配置 | 按任务需求开关 |
| 多模态 | 原生支持 | 图像输入 |
| SWE-Bench Verified | 77.6% | 编程任务指标 |
| MMLU | 未公布 | 截至本文发稿 |
| HumanEval | 未公布 | 截至本文发稿 |
| API 定价(输入) | $1.50 / M tokens | 截至本文发稿 |
| 发布日期 | 2026-04-29 | Mistral 官方 |
Le Chat Work 模式:把 CLI 会话传上云端
Le Chat 的 Work 模式,是这次发布里最有意思的一块,也是被报道最少的一块。
它不是"在聊天界面里用 AI 写代码",设计逻辑更接近另一个东西:你在本地 CLI 开了一个编程会话,任务跑到一半要去开会,可以把这个会话整个"传送"到云端,让它继续跑,你回来看结果就行。Mistral 官方用 teleport 这个词,会话状态、任务进度、历史记录、待审批项,打包迁移到云端异步执行。
这个体验更接近给一个会自己干活的同事布置任务,而不是一直盯着聊天窗口等输出。
接入了哪些工具
Work 模式目前支持接入 GitHub、Jira 和 Slack,据 Open Data Science 对 Mistral 发布的报道。AI 可以在这些工具里执行操作,创建 PR、更新 Issue、发送消息,操作前会显示完整的工具调用链路,敏感操作需要用户手动批准。
这个透明度设计跟 Anthropic 在 Claude.ai 里做的 agent 交互模式思路一致,都是试图降低用户对"AI 在我的工具里乱搞"的顾虑。批准,是信任建立的过程,不是功能缺陷。
Work 模式的核心价值不是"更快",而是"不用盯着"。任务在跑,你去开会,结果出来了有通知。这对工程师来说是一种真实的工作流变化,不是 demo。
目前 Work 模式还是预览状态,接入的工具数量有限。按 Mistral 的节奏,完整能力预计在 2026 年下半年陆续开放。
与美国编排工具横向对比:差异化在哪
LangGraph、CrewAI、Dify、n8n,你可能已经在用或者评估过其中几个。Mistral Workflows 进来,差异点在哪,值得认真对比。
| 工具 | 技术底座 | AI 原生度 | 部署方式 | 数据主权 | 模型绑定 |
|---|---|---|---|---|---|
| LangGraph | 图模型,Python | 高 | 需自托管 | 由部署决定 | 模型无关 |
| CrewAI | 多智能体框架 | 高 | 有托管版 | 有限 | 模型无关 |
| Dify | 可视化构建,低代码 | 中 | 有云版 | 有限 | 模型无关 |
| n8n | 通用 workflow | 低 | 支持自托管 | 较好 | 模型无关 |
| Mistral Workflows | Temporal,Python | 高 | 控制面托管 + 数据面客户侧 | 架构层面保障 | 绑定 Mistral 生态 |
最明显的差异点是两个。
第一,生产验证背书。 Workflows 上线时就带着每日百万级执行量和 ASML 这种制造业头部客户的案例。LangGraph 和 CrewAI 虽然社区更大,但企业级的生产验证是用户自己做的,风险自己承担。对于需要向 CTO 和法务汇报的团队,有案例背书和没有,评估门槛差很多。
第二,数据主权的架构设计。 这是欧洲公司面向欧洲企业的核心卖点,不是说说而已,是在架构层面做进去的。数据面在客户环境里跑,符合 GDPR 的基本要求,不需要额外的数据处理协议。这对 LangGraph、CrewAI 这些美国背景的工具来说是先天的结构性劣势。
当然,Workflows 也有劣势。目前只支持 Python,没有 TypeScript 或其他语言的 SDK。对 Mistral 模型生态有依赖,如果你的方案需要混用多家模型,灵活度不如 LangGraph。社区生态方面,比不上 LangChain 系列积累了三年的插件和教程库。还有一个务实的考虑,Workflows 公开预览才上线,API 接口可能还会变。现在重押的话,要接受未来可能有迁移成本。
Mistral 的全栈逻辑
讲到这里,可以回到最开始那个问题:Mistral 在做什么。
融资数字能说明一些事。2025 年 9 月,Mistral 官方公告完成 1.7B 欧元 C 轮融资,估值 11.7B 欧元,由 ASML、Andreessen Horowitz、Nvidia、General Catalyst 等参投。2026 年 3 月,再从七家银行拿了 8.3 亿美元债务融资,规划长期 40 亿欧元的算力投入,目标是在欧洲建 200 兆瓦的计算容量,截至 2026 年末。
这不是一家只想出模型卖 API 的公司的资本布局。
美国 AI 公司,无论 OpenAI 还是 Anthropic,基本走的是"模型即服务"路线,编排层交给 LangChain、LlamaIndex 或云厂商的托管方案。Mistral 选择自己搭控制面,把模型、编排、应用界面三层拿在一起。
这条路更重,融资烧得更多,但如果走通,护城河更难被复制。一家欧洲公司在美国 AI 巨头包围里谈差异化,靠的不是算法上的领先,靠的是"你们的数据我不碰"这件事,以及在架构层面把这个承诺兑现。
对你来说,判断取决于你的场景。如果是欧洲团队或者有欧洲客户,Workflows 值得认真评估,不光是合规,也因为生产验证已经有了。如果你已经在用 LangGraph 或 n8n,短期迁移成本不划算,可以等 Mistral 的生态再跑半年再做决策。如果是全新项目,把 Workflows 列进短名单,做一个 POC 验证一下实际的 Python API 体验,然后再决定。
写在最后
Mistral 在一周内做了三件事,每件单独看都不算颠覆,合在一起是一个完整的战略切面。Workflows 是生产层,Medium 3.5 是能力层,Le Chat Work 是应用层,三层对齐,欧洲 AI 第一次把这条从模型到应用的路讲清楚了。
能不能走通,要看接下来六到十二个月的执行,以及 MMLU 这些基础 benchmark 什么时候愿意公布。但方向已经摆在那里了。
延伸资源