MATLAB Agentic Toolkit到底解决了什么问题?一篇看懂MathWorks如何把工程软件接进AI Agent工作流

摘要:MathWorks新发布的MATLAB Agentic Toolkit,本质上不是一个简单的“让AI会写MATLAB代码”的插件,而是一套把MATLAB能力、工程知识和AI代理工作流绑定起来的基础设施。它一边通过MATLAB MCP Core Server给AI代理接上可执行的MATLAB环境,一边通过skills把MATLAB工程师的最佳实践注入代理,让AI不只是“会写几行.m文件”,而是能以更接近真实工程团队的方式完成建模、测试、诊断、应用开发与工具箱调用。

MATLAB Agentic Toolkit的意义,不只是让AI能写MATLAB,而是把工程软件真正接进Agent工作流

大模型开始进入工程软件世界之后,一个很常见的误解是:只要模型会写代码,它就能自然接管工程任务。

这在Web开发里可能还勉强成立一部分,但到了MATLAB、Simulink、信号处理、控制系统、图像处理、射频设计这些典型工程领域,事情马上就变复杂了。

原因很简单。工程软件不是通用文本空间,而是高度约束、强工具链依赖、强领域知识驱动的工作环境。 你让一个AI代理直接去写MATLAB,它当然能写出一些语法正确的 .m 文件,但这和“它真的懂MATLAB工程工作流”完全是两回事。

MathWorks这次发布的 MATLAB Agentic Toolkit,本质上就是在解决这个断层。

它不是一个单纯的代码补全插件,也不是把MATLAB包装成一个能被聊天机器人调用的黑盒接口。它真正想做的,是把 MATLAB能力、工程上下文、最佳实践和AI Agent执行链路 整合成一个可以长期复用的工作框架。

如果说很多所谓“AI+工程软件”的方案还停留在演示层,那么 MATLAB Agentic Toolkit 更像是在认真回答一个问题:怎样让AI代理在工程软件里像一个受过训练的初级工程师,而不是一个会乱敲命令的脚本生成器?

MATLAB代码、LLM API、MCP客户端与外部MCP Server之间的协同关系

一、它解决的核心问题,不是“连上MATLAB”,而是“让Agent别瞎用MATLAB”

MathWorks在项目说明里讲得很直白:今天的AI coding agent 已经越来越“能用”MATLAB,但“能用”不等于“专业”。

这句话非常关键。

因为真正的问题从来不是模型写不出MATLAB语法,而是它不知道:

  • 哪些功能工具箱里已经有成熟函数,不需要自己重造轮子
  • 哪种写法更符合MATLAB社区的惯例和性能习惯
  • 什么时候该先做静态检查,什么时候该直接运行测试
  • 什么场景应该建 app,什么场景应该拆脚本,什么场景应该调 toolbox 而不是自己硬写算法
  • 如何在有限上下文下快速定位错误,而不是盲目改代码

这些东西,恰恰是工程实践里最贵的部分。

所以 MATLAB Agentic Toolkit 的真正价值,不是“让AI有 MATLAB API 可调”,而是给AI代理注入一层经过整理的MATLAB工程常识和任务套路

换句话说,它想解决的是从“会写MATLAB”到“会像MATLAB工程师那样工作”之间的鸿沟。

二、这套架构有两个核心部件:MCP连接 + Skills知识层

整个工具包其实很清晰,可以拆成两层理解。

第一层:MATLAB MCP Core Server

这是执行层。

它的作用是把AI代理和真实MATLAB环境接起来,让代理不只是读写文件,而是能真的运行MATLAB代码、执行测试、获取结果、做静态分析、识别工具箱环境

根据官方说明,当前主要暴露了几个能力:

  • evaluate_matlab_code:直接运行 MATLAB 代码并返回命令行输出
  • run_matlab_file:运行一个 MATLAB 程序文件
  • run_matlab_test_file:通过 runtests 跑测试,并返回结构化结果
  • check_matlab_code:调用 Code Analyzer 做静态分析
  • detect_matlab_toolboxes:识别 MATLAB 版本及已安装工具箱

这意味着什么?

意味着AI代理第一次真正具备了“闭环工程执行能力”。它不是写完代码就停,而是能:写代码、跑代码、看报错、改代码、跑测试、再修正。

这和很多停留在“生成建议代码片段”的AI插件相比,层级完全不同。

AI Agent、MCP Server 与 MATLAB执行环境之间的桥接关系

第二层:Skills Catalog

这是知识层。

如果说 MCP Server 解决的是“能不能动手”,那 skills 解决的是“该怎么动手”。

MathWorks把技能目录做成了多个领域模块,比如:

  • MATLAB Core
  • MATLAB App Building
  • MATLAB Software Development
  • Image Processing and Computer Vision
  • Signal Processing
  • RF and Mixed Signal
  • Wireless Communications
  • Reporting and Database Access

这套设计非常聪明。

在Claude Code中接入MATLAB Agentic Toolkit后的工具、技能与资源展示界面

因为它没有幻想用一个总提示词去统治所有工程场景,而是承认:不同领域的问题,需要不同的工程策略和工具调用习惯。

例如,图像处理代理需要知道怎么处理图片数据、调用视觉工具箱、组织实验;信号处理代理需要知道采样、滤波、频谱分析、测试流程;应用开发代理则需要理解 UI 结构、App Designer 逻辑和交互行为。

本质上,skills 就是把MATLAB生态里分散的“隐性知识”做成了可被AI代理按需读取的显性知识包。

三、它最值得重视的一点,是把“工具调用”升级成“工程工作流”

很多人现在一提 Agent,就容易想到工具调用:给模型几个函数,让它自己挑着调。

但只靠工具调用,通常做不出可靠的工程系统。

因为工程任务不是一个命令接一个命令那么简单,而是一整条有顺序、有约束、有验证机制的链路。比如一个典型MATLAB任务往往不是“写个函数”就完了,而是:

  1. 判断已有工具箱能不能直接解决问题
  2. 写最小可用版本
  3. 跑 Code Analyzer 看静态问题
  4. 写测试或基准验证逻辑
  5. 跑测试观察结果
  6. 根据工具箱、数值稳定性、性能和可读性继续优化
  7. 如果要交付非开发人员使用,再考虑封装成 app 或脚本入口

MATLAB Agentic Toolkit 的意义就在于,它在努力把这条链路变成代理可执行的标准路径。

这也是为什么我觉得它比很多“工程AI助手”更成熟。它不是在炫一个接口,而是在认真尝试把 MATLAB的专业工作方式 迁移到 Agent 时代。

四、为什么这件事对工业智能尤其重要?

因为 MATLAB 在工业世界里不是一个边缘工具,而是大量高价值工程工作的底座。

控制、仿真、算法验证、信号处理、图像分析、无线通信、系统建模、测试验证,这些能力长期都深埋在 MATLAB/Simulink 体系里。很多企业的关键知识,并不在 PPT 上,而在成千上万行 .m 代码、模型、脚本、测试文件和工具箱依赖里。

所以当我们讨论“工业智能”或者“AI进入工程研发流程”时,一个真正绕不过去的问题是:

AI代理能不能进入这些传统但高价值的软件环境,而不是只会在通用代码仓库里改 JavaScript。

MATLAB Agentic Toolkit 给出的答案是,可以,但前提不是裸进,而是要带着连接、知识和工作规程一起进去。

这件事如果往大了看,代表的是一种趋势:

未来每一种重要工程软件,都会需要自己的 Agent 接入层。

从传统生成式AI到带工具的生成式AI,再到Agentic AI的能力演进

不是把聊天框贴在软件边上就算完成,而是要回答:

  • 代理如何安全连接执行环境?
  • 如何识别已安装能力和版本?
  • 如何继承该软件生态的最佳实践?
  • 如何把测试、校验、静态分析纳入闭环?
  • 如何控制 token 消耗,不让代理在陌生领域里胡乱探索?

MathWorks这套工具包,其实就是这个范式的一个标准答案。

五、它也暴露出Agent进入工程软件的几个现实边界

当然,这套方案并不是没有边界。

首先,它有明确前提:MATLAB R2020b 或更高版本,并且需要本地可用环境。也就是说,它不是一个纯SaaS网页助手,而是建立在你已有 MATLAB 基础设施之上的代理增强层。

其次,官方在安全上写得很克制,明确提醒用户:对重要操作必须保持 human in the loop,认真审查所有工具调用。这说明 MathWorks 自己也很清楚,工程环境不是能完全放任代理自由执行的地方。

再者,它对 MATLAB MCP Core Server 的使用方式也有限制,强调只能和作为 Personal Automation Server 的 MATLAB 安装一起使用,不允许拿去做集中式 Automation Server。这背后其实也是典型的企业软件许可与架构边界问题。

换句话说,MathWorks虽然在拥抱 Agent,但它并没有把自己包装成“完全自治”的未来幻想。它更像是走了一条相对稳健的路线:先让代理在个人或小团队工作流里变得真正有用,再慢慢往更复杂的协同和企业环境延伸。

六、真正值得关注的,不是这个仓库本身,而是MathWorks的产品方向变了

最后我想说,MATLAB Agentic Toolkit最值得研究的,不只是它的技术细节,而是它释放的产品信号。

过去很多工程软件公司面对AI,策略大多比较保守:加点自然语言接口、做点自动生成、放几个助手按钮,先不破坏原有产品逻辑。

但 MathWorks 这次更进一步了。它不是只在 MATLAB 里放一个 AI 功能,而是在承认一个新现实:

未来会有越来越多工程任务,不是由人直接点菜单完成,而是由 AI 代理跨文件、跨工具、跨测试链路去完成。

这意味着软件厂商的角色也在变。

以前厂商主要提供的是:

  • 功能
  • UI
  • 文档
  • 工具箱

现在还要多提供两样东西:

  • 适合 Agent 调用的执行接口
  • 可供 Agent 学习的专家级工作知识

这正是 MATLAB Agentic Toolkit 在做的事。

从这个意义上说,它不是一个小插件,而是一个信号:传统工程软件厂商已经开始系统性地为 Agent 时代重写自己的接入层。

而一旦这件事在 MATLAB 这种工程重软件里走通,后面 CAD、CAE、EDA、PLM、仿真、测试平台都会跟进。

所以,如果你把它只看成“MATLAB也能让AI写代码了”,那就低估它了。

它真正代表的是,工程软件世界正在从“人使用工具”走向“人指挥代理,代理调用工具”。

这一步一旦迈过去,工业研发流程会被重新改写。

而 MATLAB Agentic Toolkit,可能就是这条路径上一个很值得记住的早期样本。


参考来源:

  1. GitHub: matlab/matlab-agentic-toolkit
  2. GitHub: matlab/matlab-mcp-core-server
  3. MATLAB Agentic Toolkit Getting Started guide
  4. MATLAB Agentic Toolkit skills catalog
  5. MathWorks documentation on MCP and Personal Automation Server usage
分享到