Newsroom
AIEII

Mistral 发布 Workflows 编排引擎:欧洲 AI 独角兽的全栈野心拆解

法国 AI 公司 Mistral 同步发布 Workflows 生产级编排引擎和 128B 旗舰模型,Le Chat 新增 Work 智能体模式支持异步云端编程,全栈布局从模型到应用的完整路径。

2026年05月18日

Mistral 发布 Workflows 编排引擎:欧洲 AI 独角兽的全栈野心拆解

欧洲 AI 公司的故事,通常到发布模型就结束了。

Mistral 在 2026 年 4 月底连发了三件事:Workflows 编排引擎进入公开预览、128B 旗舰模型 Medium 3.5 开放 API、Le Chat 新增 Work 智能体模式。单看任何一件都不算颠覆性,但三件事摆在一起,你才能看清楚这家法国公司想要什么。

这不是又一轮"我们出了个更好的模型"。Mistral 在用一种不一样的方式,从模型往上一层一层地搭。


Workflows 是什么:Temporal 驱动的生产级编排引擎

2026 年 4 月 28 日,Mistral 在 Mistral Studio 里上线了 Workflows 公开预览版,面向企业自动化团队。

官方定位很清楚:用来定义、执行和监控多步骤 AI 流程的结构化系统。从简单的顺序任务,到复杂的有状态操作,从纯确定性的业务规则,到 LLM 的概率输出,都可以在同一个编排层里跑。

底层基础设施是 Temporal 的 durable execution engine。这套东西 Netflix、Stripe、Salesforce 都在用,算是分布式编排领域的事实标准。Mistral 在上面加了几层 AI 专用扩展:流式输出处理、大 payload 管理、多租户隔离、可观测性。不是自己从头造,而是站在已经经过生产验证的基础上往上加。

上线时,Workflows 就已经在运行每日数百万次的执行量。这个数字不是营销数字,是他们在内部自己用了足够长时间之后才对外开放的结果,据 VentureBeat 报道如此。

架构设计:控制面和数据面分离

这是 Workflows 最值得关注的架构决策。

编排控制面跑在 Mistral 托管的基础设施上,但执行 worker 和数据处理留在客户自己的环境里,不管是公有云、本地机房,还是混合部署都行。两个面各司其职,不强行绑在一起。

对企业来说,这意味着数据不出境,编排逻辑归 Mistral 管。合规压力大的行业,这个架构设计基本上是准入门槛,不需要客户再签一堆数据处理补充协议。ASML、法国邮政银行(La Banque Postale)、法国劳工局(France Travail)、航运集团 CMA-CGM 已经在用了。这些机构的数据合规要求,出了欧洲的公司很难满足。

开发体验:Python 写,Le Chat 触发

开发者用 Python 写 workflow,部署之后可以直接发布到 Le Chat,让组织里任何人都能触发它,不需要懂代码。典型的编排结构大概长这样:

from mistral.workflows import workflow, step

@workflow
def document_review_pipeline(document_url: str):
    # 顺序执行,每步有独立的重试策略和超时配置
    extracted = step(extract_content, document_url)
    summary = step(summarize, extracted, model="mistral-medium-3.5")
    # human-in-the-loop 作为一等公民
    approval = step(request_human_approval, summary)
    if approval.approved:
        return step(publish, summary)
    return step(archive, summary)

重试策略、链路追踪、超时设置、限流,都可以通过 decorator 和单行配置完成,不需要在业务逻辑里手写这些防御性代码。

Workflows 把 human-in-the-loop 做成了原生特性,而不是事后加的补丁。一个 workflow 可以暂停,等人审批,然后从同一个断点继续,整个等待过程不消耗计算资源。这在传统编排工具里需要自己写状态机来实现。


Mistral Medium 3.5:128B 模型的定价逻辑

Medium 3.5 在 Workflows 上线一天后发布,也就是 2026 年 4 月 29 日。

参数量 128B,上下文窗口 256K,支持可配置推理,原生多模态输入。这是 Mistral 目前开放权重里规格最高的模型。定价方面,API 输入 $1.50 每百万 tokens。

这个价格放在当前市场上是什么位置,往上比旗舰闭源模型便宜一个数量级,往下比 Mistral 自家的小模型贵。它瞄准的是"效果够用,预算可控"的企业生产场景,不是做最强,是做最合适。

跑分:SWE-Bench 77.6%,MMLU 没公布

这里需要说一个不太好看的实情。

Medium 3.5 的 MMLU、HumanEval、MATH 跑分,Mistral 目前没有公布。他们选择发布的是 SWE-Bench Verified 77.6%,编程任务上接近但没有超过 Claude Sonnet 4.6,数据来自 MarkTechPost 对 Mistral 官方发布材料的整理。

对于一家把"开放"当成核心叙事的公司,缺少主流 benchmark 数据是个明显的信息缺口。你在做技术选型时,这一点要算进去。

参考系可以用 Mistral Large 3:在 MMLU 8 语言评测上大约 85.5%,HumanEval pass@1 约 92%。那是更大的模型,但可以给你一个上限感知。

指标Mistral Medium 3.5备注
参数量128B开放权重
上下文窗口256K tokens长文档处理友好
推理模式可配置按任务需求开关
多模态原生支持图像输入
SWE-Bench Verified77.6%编程任务指标
MMLU未公布截至本文发稿
HumanEval未公布截至本文发稿
API 定价(输入)$1.50 / M tokens截至本文发稿
发布日期2026-04-29Mistral 官方

Le Chat Work 模式:把 CLI 会话传上云端

Le Chat 的 Work 模式,是这次发布里最有意思的一块,也是被报道最少的一块。

它不是"在聊天界面里用 AI 写代码",设计逻辑更接近另一个东西:你在本地 CLI 开了一个编程会话,任务跑到一半要去开会,可以把这个会话整个"传送"到云端,让它继续跑,你回来看结果就行。Mistral 官方用 teleport 这个词,会话状态、任务进度、历史记录、待审批项,打包迁移到云端异步执行。

这个体验更接近给一个会自己干活的同事布置任务,而不是一直盯着聊天窗口等输出。

接入了哪些工具

Work 模式目前支持接入 GitHub、Jira 和 Slack,据 Open Data Science 对 Mistral 发布的报道。AI 可以在这些工具里执行操作,创建 PR、更新 Issue、发送消息,操作前会显示完整的工具调用链路,敏感操作需要用户手动批准。

这个透明度设计跟 Anthropic 在 Claude.ai 里做的 agent 交互模式思路一致,都是试图降低用户对"AI 在我的工具里乱搞"的顾虑。批准,是信任建立的过程,不是功能缺陷。

Work 模式的核心价值不是"更快",而是"不用盯着"。任务在跑,你去开会,结果出来了有通知。这对工程师来说是一种真实的工作流变化,不是 demo。

目前 Work 模式还是预览状态,接入的工具数量有限。按 Mistral 的节奏,完整能力预计在 2026 年下半年陆续开放。


与美国编排工具横向对比:差异化在哪

LangGraph、CrewAI、Dify、n8n,你可能已经在用或者评估过其中几个。Mistral Workflows 进来,差异点在哪,值得认真对比。

工具技术底座AI 原生度部署方式数据主权模型绑定
LangGraph图模型,Python需自托管由部署决定模型无关
CrewAI多智能体框架有托管版有限模型无关
Dify可视化构建,低代码有云版有限模型无关
n8n通用 workflow支持自托管较好模型无关
Mistral WorkflowsTemporal,Python控制面托管 + 数据面客户侧架构层面保障绑定 Mistral 生态

最明显的差异点是两个。

第一,生产验证背书。 Workflows 上线时就带着每日百万级执行量和 ASML 这种制造业头部客户的案例。LangGraph 和 CrewAI 虽然社区更大,但企业级的生产验证是用户自己做的,风险自己承担。对于需要向 CTO 和法务汇报的团队,有案例背书和没有,评估门槛差很多。

第二,数据主权的架构设计。 这是欧洲公司面向欧洲企业的核心卖点,不是说说而已,是在架构层面做进去的。数据面在客户环境里跑,符合 GDPR 的基本要求,不需要额外的数据处理协议。这对 LangGraph、CrewAI 这些美国背景的工具来说是先天的结构性劣势。

当然,Workflows 也有劣势。目前只支持 Python,没有 TypeScript 或其他语言的 SDK。对 Mistral 模型生态有依赖,如果你的方案需要混用多家模型,灵活度不如 LangGraph。社区生态方面,比不上 LangChain 系列积累了三年的插件和教程库。还有一个务实的考虑,Workflows 公开预览才上线,API 接口可能还会变。现在重押的话,要接受未来可能有迁移成本。


Mistral 的全栈逻辑

讲到这里,可以回到最开始那个问题:Mistral 在做什么。

融资数字能说明一些事。2025 年 9 月,Mistral 官方公告完成 1.7B 欧元 C 轮融资,估值 11.7B 欧元,由 ASML、Andreessen Horowitz、Nvidia、General Catalyst 等参投。2026 年 3 月,再从七家银行拿了 8.3 亿美元债务融资,规划长期 40 亿欧元的算力投入,目标是在欧洲建 200 兆瓦的计算容量,截至 2026 年末。

这不是一家只想出模型卖 API 的公司的资本布局。

美国 AI 公司,无论 OpenAI 还是 Anthropic,基本走的是"模型即服务"路线,编排层交给 LangChain、LlamaIndex 或云厂商的托管方案。Mistral 选择自己搭控制面,把模型、编排、应用界面三层拿在一起。

这条路更重,融资烧得更多,但如果走通,护城河更难被复制。一家欧洲公司在美国 AI 巨头包围里谈差异化,靠的不是算法上的领先,靠的是"你们的数据我不碰"这件事,以及在架构层面把这个承诺兑现。

对你来说,判断取决于你的场景。如果是欧洲团队或者有欧洲客户,Workflows 值得认真评估,不光是合规,也因为生产验证已经有了。如果你已经在用 LangGraph 或 n8n,短期迁移成本不划算,可以等 Mistral 的生态再跑半年再做决策。如果是全新项目,把 Workflows 列进短名单,做一个 POC 验证一下实际的 Python API 体验,然后再决定。


写在最后

Mistral 在一周内做了三件事,每件单独看都不算颠覆,合在一起是一个完整的战略切面。Workflows 是生产层,Medium 3.5 是能力层,Le Chat Work 是应用层,三层对齐,欧洲 AI 第一次把这条从模型到应用的路讲清楚了。

能不能走通,要看接下来六到十二个月的执行,以及 MMLU 这些基础 benchmark 什么时候愿意公布。但方向已经摆在那里了。


延伸资源

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← 微软 Agent 365 上线:AI 智能体终于有了企业级治 … 谷歌把 Android 变成智能体操作系统:Gemini … →
💬 Comments
8 min read