Mistral 发布 Workflows 编排引擎：欧洲 AI 独角兽的全栈野心拆解

AIEII

欧洲 AI 公司的故事，通常到发布模型就结束了。

Mistral 在 2026 年 4 月底连发了三件事：Workflows 编排引擎进入公开预览、128B 旗舰模型 Medium 3.5 开放 API、Le Chat 新增 Work 智能体模式。单看任何一件都不算颠覆性，但三件事摆在一起，你才能看清楚这家法国公司想要什么。

这不是又一轮"我们出了个更好的模型"。Mistral 在用一种不一样的方式，从模型往上一层一层地搭。

Workflows 是什么：Temporal 驱动的生产级编排引擎

2026 年 4 月 28 日，Mistral 在 Mistral Studio 里上线了 Workflows 公开预览版，面向企业自动化团队。

官方定位很清楚：用来定义、执行和监控多步骤 AI 流程的结构化系统。从简单的顺序任务，到复杂的有状态操作，从纯确定性的业务规则，到 LLM 的概率输出，都可以在同一个编排层里跑。

底层基础设施是 Temporal 的 durable execution engine。这套东西 Netflix、Stripe、Salesforce 都在用，算是分布式编排领域的事实标准。Mistral 在上面加了几层 AI 专用扩展：流式输出处理、大 payload 管理、多租户隔离、可观测性。不是自己从头造，而是站在已经经过生产验证的基础上往上加。

上线时，Workflows 就已经在运行每日数百万次的执行量。这个数字不是营销数字，是他们在内部自己用了足够长时间之后才对外开放的结果，据 VentureBeat 报道如此。

架构设计：控制面和数据面分离

这是 Workflows 最值得关注的架构决策。

编排控制面跑在 Mistral 托管的基础设施上，但执行 worker 和数据处理留在客户自己的环境里，不管是公有云、本地机房，还是混合部署都行。两个面各司其职，不强行绑在一起。

对企业来说，这意味着数据不出境，编排逻辑归 Mistral 管。合规压力大的行业，这个架构设计基本上是准入门槛，不需要客户再签一堆数据处理补充协议。ASML、法国邮政银行（La Banque Postale）、法国劳工局（France Travail）、航运集团 CMA-CGM 已经在用了。这些机构的数据合规要求，出了欧洲的公司很难满足。

开发体验：Python 写，Le Chat 触发

开发者用 Python 写 workflow，部署之后可以直接发布到 Le Chat，让组织里任何人都能触发它，不需要懂代码。典型的编排结构大概长这样：

from mistral.workflows import workflow, step

@workflow
def document_review_pipeline(document_url: str):
    # 顺序执行，每步有独立的重试策略和超时配置
    extracted = step(extract_content, document_url)
    summary = step(summarize, extracted, model="mistral-medium-3.5")
    # human-in-the-loop 作为一等公民
    approval = step(request_human_approval, summary)
    if approval.approved:
        return step(publish, summary)
    return step(archive, summary)

重试策略、链路追踪、超时设置、限流，都可以通过 decorator 和单行配置完成，不需要在业务逻辑里手写这些防御性代码。

Workflows 把 human-in-the-loop 做成了原生特性，而不是事后加的补丁。一个 workflow 可以暂停，等人审批，然后从同一个断点继续，整个等待过程不消耗计算资源。这在传统编排工具里需要自己写状态机来实现。

Mistral Medium 3.5：128B 模型的定价逻辑

Medium 3.5 在 Workflows 上线一天后发布，也就是 2026 年 4 月 29 日。

参数量 128B，上下文窗口 256K，支持可配置推理，原生多模态输入。这是 Mistral 目前开放权重里规格最高的模型。定价方面，API 输入 $1.50 每百万 tokens。

这个价格放在当前市场上是什么位置，往上比旗舰闭源模型便宜一个数量级，往下比 Mistral 自家的小模型贵。它瞄准的是"效果够用，预算可控"的企业生产场景，不是做最强，是做最合适。

跑分：SWE-Bench 77.6%，MMLU 没公布

这里需要说一个不太好看的实情。

Medium 3.5 的 MMLU、HumanEval、MATH 跑分，Mistral 目前没有公布。他们选择发布的是 SWE-Bench Verified 77.6%，编程任务上接近但没有超过 Claude Sonnet 4.6，数据来自 MarkTechPost 对 Mistral 官方发布材料的整理。

对于一家把"开放"当成核心叙事的公司，缺少主流 benchmark 数据是个明显的信息缺口。你在做技术选型时，这一点要算进去。

参考系可以用 Mistral Large 3：在 MMLU 8 语言评测上大约 85.5%，HumanEval pass@1 约 92%。那是更大的模型，但可以给你一个上限感知。

指标	Mistral Medium 3.5	备注
参数量	128B	开放权重
上下文窗口	256K tokens	长文档处理友好
推理模式	可配置	按任务需求开关
多模态	原生支持	图像输入
SWE-Bench Verified	77.6%	编程任务指标
MMLU	未公布	截至本文发稿
HumanEval	未公布	截至本文发稿
API 定价（输入）	$1.50 / M tokens	截至本文发稿
发布日期	2026-04-29	Mistral 官方

Le Chat Work 模式：把 CLI 会话传上云端

Le Chat 的 Work 模式，是这次发布里最有意思的一块，也是被报道最少的一块。

它不是"在聊天界面里用 AI 写代码"，设计逻辑更接近另一个东西：你在本地 CLI 开了一个编程会话，任务跑到一半要去开会，可以把这个会话整个"传送"到云端，让它继续跑，你回来看结果就行。Mistral 官方用 teleport 这个词，会话状态、任务进度、历史记录、待审批项，打包迁移到云端异步执行。

这个体验更接近给一个会自己干活的同事布置任务，而不是一直盯着聊天窗口等输出。

接入了哪些工具

Work 模式目前支持接入 GitHub、Jira 和 Slack，据 Open Data Science 对 Mistral 发布的报道。AI 可以在这些工具里执行操作，创建 PR、更新 Issue、发送消息，操作前会显示完整的工具调用链路，敏感操作需要用户手动批准。

这个透明度设计跟 Anthropic 在 Claude.ai 里做的 agent 交互模式思路一致，都是试图降低用户对"AI 在我的工具里乱搞"的顾虑。批准，是信任建立的过程，不是功能缺陷。

Work 模式的核心价值不是"更快"，而是"不用盯着"。任务在跑，你去开会，结果出来了有通知。这对工程师来说是一种真实的工作流变化，不是 demo。

目前 Work 模式还是预览状态，接入的工具数量有限。按 Mistral 的节奏，完整能力预计在 2026 年下半年陆续开放。

与美国编排工具横向对比：差异化在哪

LangGraph、CrewAI、Dify、n8n，你可能已经在用或者评估过其中几个。Mistral Workflows 进来，差异点在哪，值得认真对比。

工具	技术底座	AI 原生度	部署方式	数据主权	模型绑定
LangGraph	图模型，Python	高	需自托管	由部署决定	模型无关
CrewAI	多智能体框架	高	有托管版	有限	模型无关
Dify	可视化构建，低代码	中	有云版	有限	模型无关
n8n	通用 workflow	低	支持自托管	较好	模型无关
Mistral Workflows	Temporal，Python	高	控制面托管 + 数据面客户侧	架构层面保障	绑定 Mistral 生态

最明显的差异点是两个。

第一，生产验证背书。 Workflows 上线时就带着每日百万级执行量和 ASML 这种制造业头部客户的案例。LangGraph 和 CrewAI 虽然社区更大，但企业级的生产验证是用户自己做的，风险自己承担。对于需要向 CTO 和法务汇报的团队，有案例背书和没有，评估门槛差很多。

第二，数据主权的架构设计。 这是欧洲公司面向欧洲企业的核心卖点，不是说说而已，是在架构层面做进去的。数据面在客户环境里跑，符合 GDPR 的基本要求，不需要额外的数据处理协议。这对 LangGraph、CrewAI 这些美国背景的工具来说是先天的结构性劣势。

当然，Workflows 也有劣势。目前只支持 Python，没有 TypeScript 或其他语言的 SDK。对 Mistral 模型生态有依赖，如果你的方案需要混用多家模型，灵活度不如 LangGraph。社区生态方面，比不上 LangChain 系列积累了三年的插件和教程库。还有一个务实的考虑，Workflows 公开预览才上线，API 接口可能还会变。现在重押的话，要接受未来可能有迁移成本。

Mistral 的全栈逻辑

讲到这里，可以回到最开始那个问题：Mistral 在做什么。

融资数字能说明一些事。2025 年 9 月，Mistral 官方公告完成 1.7B 欧元 C 轮融资，估值 11.7B 欧元，由 ASML、Andreessen Horowitz、Nvidia、General Catalyst 等参投。2026 年 3 月，再从七家银行拿了 8.3 亿美元债务融资，规划长期 40 亿欧元的算力投入，目标是在欧洲建 200 兆瓦的计算容量，截至 2026 年末。

这不是一家只想出模型卖 API 的公司的资本布局。

美国 AI 公司，无论 OpenAI 还是 Anthropic，基本走的是"模型即服务"路线，编排层交给 LangChain、LlamaIndex 或云厂商的托管方案。Mistral 选择自己搭控制面，把模型、编排、应用界面三层拿在一起。

这条路更重，融资烧得更多，但如果走通，护城河更难被复制。一家欧洲公司在美国 AI 巨头包围里谈差异化，靠的不是算法上的领先，靠的是"你们的数据我不碰"这件事，以及在架构层面把这个承诺兑现。

对你来说，判断取决于你的场景。如果是欧洲团队或者有欧洲客户，Workflows 值得认真评估，不光是合规，也因为生产验证已经有了。如果你已经在用 LangGraph 或 n8n，短期迁移成本不划算，可以等 Mistral 的生态再跑半年再做决策。如果是全新项目，把 Workflows 列进短名单，做一个 POC 验证一下实际的 Python API 体验，然后再决定。

写在最后

Mistral 在一周内做了三件事，每件单独看都不算颠覆，合在一起是一个完整的战略切面。Workflows 是生产层，Medium 3.5 是能力层，Le Chat Work 是应用层，三层对齐，欧洲 AI 第一次把这条从模型到应用的路讲清楚了。

能不能走通，要看接下来六到十二个月的执行，以及 MMLU 这些基础 benchmark 什么时候愿意公布。但方向已经摆在那里了。

延伸资源
Mistral Workflows 官方公告
VentureBeat：Mistral Workflows 技术深度报道
Mistral Medium 3.5 评测，含 SWE-Bench 详细分析
InfoQ：Le Chat Work 模式与远程 Agent 详情
Mistral C 轮融资官方公告