摘要:MathWorks新发布的MATLAB Agentic Toolkit,本质上不是一个简单的“让AI会写MATLAB代码”的插件,而是一套把MATLAB能力、工程知识和AI代理工作流绑定起来的基础设施。它一边通过MATLAB MCP Core Server给AI代理接上可执行的MATLAB环境,一边通过skills把MATLAB工程师的最佳实践注入代理,让AI不只是“会写几行.m文件”,而是能以更接近真实工程团队的方式完成建模、测试、诊断、应用开发与工具箱调用。
![]()
大模型开始进入工程软件世界之后,一个很常见的误解是:只要模型会写代码,它就能自然接管工程任务。
这在Web开发里可能还勉强成立一部分,但到了MATLAB、Simulink、信号处理、控制系统、图像处理、射频设计这些典型工程领域,事情马上就变复杂了。
原因很简单。工程软件不是通用文本空间,而是高度约束、强工具链依赖、强领域知识驱动的工作环境。 你让一个AI代理直接去写MATLAB,它当然能写出一些语法正确的 .m 文件,但这和“它真的懂MATLAB工程工作流”完全是两回事。
MathWorks这次发布的 MATLAB Agentic Toolkit,本质上就是在解决这个断层。
它不是一个单纯的代码补全插件,也不是把MATLAB包装成一个能被聊天机器人调用的黑盒接口。它真正想做的,是把 MATLAB能力、工程上下文、最佳实践和AI Agent执行链路 整合成一个可以长期复用的工作框架。
如果说很多所谓“AI+工程软件”的方案还停留在演示层,那么 MATLAB Agentic Toolkit 更像是在认真回答一个问题:怎样让AI代理在工程软件里像一个受过训练的初级工程师,而不是一个会乱敲命令的脚本生成器?

一、它解决的核心问题,不是“连上MATLAB”,而是“让Agent别瞎用MATLAB”
MathWorks在项目说明里讲得很直白:今天的AI coding agent 已经越来越“能用”MATLAB,但“能用”不等于“专业”。
这句话非常关键。
因为真正的问题从来不是模型写不出MATLAB语法,而是它不知道:
- 哪些功能工具箱里已经有成熟函数,不需要自己重造轮子
- 哪种写法更符合MATLAB社区的惯例和性能习惯
- 什么时候该先做静态检查,什么时候该直接运行测试
- 什么场景应该建 app,什么场景应该拆脚本,什么场景应该调 toolbox 而不是自己硬写算法
- 如何在有限上下文下快速定位错误,而不是盲目改代码
这些东西,恰恰是工程实践里最贵的部分。
所以 MATLAB Agentic Toolkit 的真正价值,不是“让AI有 MATLAB API 可调”,而是给AI代理注入一层经过整理的MATLAB工程常识和任务套路。
换句话说,它想解决的是从“会写MATLAB”到“会像MATLAB工程师那样工作”之间的鸿沟。
二、这套架构有两个核心部件:MCP连接 + Skills知识层
整个工具包其实很清晰,可以拆成两层理解。
第一层:MATLAB MCP Core Server
这是执行层。
它的作用是把AI代理和真实MATLAB环境接起来,让代理不只是读写文件,而是能真的运行MATLAB代码、执行测试、获取结果、做静态分析、识别工具箱环境。
根据官方说明,当前主要暴露了几个能力:
evaluate_matlab_code:直接运行 MATLAB 代码并返回命令行输出run_matlab_file:运行一个 MATLAB 程序文件run_matlab_test_file:通过runtests跑测试,并返回结构化结果check_matlab_code:调用 Code Analyzer 做静态分析detect_matlab_toolboxes:识别 MATLAB 版本及已安装工具箱
这意味着什么?
意味着AI代理第一次真正具备了“闭环工程执行能力”。它不是写完代码就停,而是能:写代码、跑代码、看报错、改代码、跑测试、再修正。
这和很多停留在“生成建议代码片段”的AI插件相比,层级完全不同。

第二层:Skills Catalog
这是知识层。
如果说 MCP Server 解决的是“能不能动手”,那 skills 解决的是“该怎么动手”。
MathWorks把技能目录做成了多个领域模块,比如:
- MATLAB Core
- MATLAB App Building
- MATLAB Software Development
- Image Processing and Computer Vision
- Signal Processing
- RF and Mixed Signal
- Wireless Communications
- Reporting and Database Access
这套设计非常聪明。

因为它没有幻想用一个总提示词去统治所有工程场景,而是承认:不同领域的问题,需要不同的工程策略和工具调用习惯。
例如,图像处理代理需要知道怎么处理图片数据、调用视觉工具箱、组织实验;信号处理代理需要知道采样、滤波、频谱分析、测试流程;应用开发代理则需要理解 UI 结构、App Designer 逻辑和交互行为。
本质上,skills 就是把MATLAB生态里分散的“隐性知识”做成了可被AI代理按需读取的显性知识包。
三、它最值得重视的一点,是把“工具调用”升级成“工程工作流”
很多人现在一提 Agent,就容易想到工具调用:给模型几个函数,让它自己挑着调。
但只靠工具调用,通常做不出可靠的工程系统。
因为工程任务不是一个命令接一个命令那么简单,而是一整条有顺序、有约束、有验证机制的链路。比如一个典型MATLAB任务往往不是“写个函数”就完了,而是:
- 判断已有工具箱能不能直接解决问题
- 写最小可用版本
- 跑 Code Analyzer 看静态问题
- 写测试或基准验证逻辑
- 跑测试观察结果
- 根据工具箱、数值稳定性、性能和可读性继续优化
- 如果要交付非开发人员使用,再考虑封装成 app 或脚本入口
MATLAB Agentic Toolkit 的意义就在于,它在努力把这条链路变成代理可执行的标准路径。
这也是为什么我觉得它比很多“工程AI助手”更成熟。它不是在炫一个接口,而是在认真尝试把 MATLAB的专业工作方式 迁移到 Agent 时代。
四、为什么这件事对工业智能尤其重要?
因为 MATLAB 在工业世界里不是一个边缘工具,而是大量高价值工程工作的底座。
控制、仿真、算法验证、信号处理、图像分析、无线通信、系统建模、测试验证,这些能力长期都深埋在 MATLAB/Simulink 体系里。很多企业的关键知识,并不在 PPT 上,而在成千上万行 .m 代码、模型、脚本、测试文件和工具箱依赖里。
所以当我们讨论“工业智能”或者“AI进入工程研发流程”时,一个真正绕不过去的问题是:
AI代理能不能进入这些传统但高价值的软件环境,而不是只会在通用代码仓库里改 JavaScript。
MATLAB Agentic Toolkit 给出的答案是,可以,但前提不是裸进,而是要带着连接、知识和工作规程一起进去。
这件事如果往大了看,代表的是一种趋势:
未来每一种重要工程软件,都会需要自己的 Agent 接入层。
![]()
不是把聊天框贴在软件边上就算完成,而是要回答:
- 代理如何安全连接执行环境?
- 如何识别已安装能力和版本?
- 如何继承该软件生态的最佳实践?
- 如何把测试、校验、静态分析纳入闭环?
- 如何控制 token 消耗,不让代理在陌生领域里胡乱探索?
MathWorks这套工具包,其实就是这个范式的一个标准答案。
五、它也暴露出Agent进入工程软件的几个现实边界
当然,这套方案并不是没有边界。
首先,它有明确前提:MATLAB R2020b 或更高版本,并且需要本地可用环境。也就是说,它不是一个纯SaaS网页助手,而是建立在你已有 MATLAB 基础设施之上的代理增强层。
其次,官方在安全上写得很克制,明确提醒用户:对重要操作必须保持 human in the loop,认真审查所有工具调用。这说明 MathWorks 自己也很清楚,工程环境不是能完全放任代理自由执行的地方。
再者,它对 MATLAB MCP Core Server 的使用方式也有限制,强调只能和作为 Personal Automation Server 的 MATLAB 安装一起使用,不允许拿去做集中式 Automation Server。这背后其实也是典型的企业软件许可与架构边界问题。
换句话说,MathWorks虽然在拥抱 Agent,但它并没有把自己包装成“完全自治”的未来幻想。它更像是走了一条相对稳健的路线:先让代理在个人或小团队工作流里变得真正有用,再慢慢往更复杂的协同和企业环境延伸。
六、真正值得关注的,不是这个仓库本身,而是MathWorks的产品方向变了
最后我想说,MATLAB Agentic Toolkit最值得研究的,不只是它的技术细节,而是它释放的产品信号。
过去很多工程软件公司面对AI,策略大多比较保守:加点自然语言接口、做点自动生成、放几个助手按钮,先不破坏原有产品逻辑。
但 MathWorks 这次更进一步了。它不是只在 MATLAB 里放一个 AI 功能,而是在承认一个新现实:
未来会有越来越多工程任务,不是由人直接点菜单完成,而是由 AI 代理跨文件、跨工具、跨测试链路去完成。
这意味着软件厂商的角色也在变。
以前厂商主要提供的是:
- 功能
- UI
- 文档
- 工具箱
现在还要多提供两样东西:
- 适合 Agent 调用的执行接口
- 可供 Agent 学习的专家级工作知识
这正是 MATLAB Agentic Toolkit 在做的事。
从这个意义上说,它不是一个小插件,而是一个信号:传统工程软件厂商已经开始系统性地为 Agent 时代重写自己的接入层。
而一旦这件事在 MATLAB 这种工程重软件里走通,后面 CAD、CAE、EDA、PLM、仿真、测试平台都会跟进。
所以,如果你把它只看成“MATLAB也能让AI写代码了”,那就低估它了。
它真正代表的是,工程软件世界正在从“人使用工具”走向“人指挥代理,代理调用工具”。
这一步一旦迈过去,工业研发流程会被重新改写。
而 MATLAB Agentic Toolkit,可能就是这条路径上一个很值得记住的早期样本。
参考来源:
- GitHub: matlab/matlab-agentic-toolkit
- GitHub: matlab/matlab-mcp-core-server
- MATLAB Agentic Toolkit Getting Started guide
- MATLAB Agentic Toolkit skills catalog
- MathWorks documentation on MCP and Personal Automation Server usage