CHAPTER 04

博雅实践
工业智能与安全底座

告别纯理论，展示 Agent 在零容错实体业务中的真实落地与防线构建

容错率为零

工业现场不相信大模型的“奇迹”，只相信绝对的控制。

互联网：写错一行代码可以回滚。
实体业务：关错一个阀门就是物理灾难。

数字底座

博雅工业智能算网与数字员工矩阵

ai.gyznsw.cn

算网调度池

GPU 集群 Alpha98% 活跃

边缘计算节点 B在线

数字员工队列

排程调拨专员

处理中...

产线监控网关

挂机监听

从“被动调用 API”到“主动编排数字员工矩阵”。

架构剖析

底层依赖：双路记忆与数字员工四重分身

时序数据库 (TSDB)

毫秒级传感器心跳、实时波动

向量数据库 (Vector DB)

跨越十年的历史工单与图纸

反内耗：严格隔离四重身份

架构副驾

全局意图理解与任务链拆解规划

清洗专员

权限降级模型，对冲传感器漂移与高频噪音

防火墙

智能 QA (独立网关)

具备“敌意”视角，无情拦截违规、越权指令

AIOps 运维中枢

唯一拥有物理执行权，受最终人工审批约束

实战案例 1

医药 ERP：从一张截图到一个闭环系统

Legacy_ERP_Export.xls / 截图识别

临期警报

被动：肉眼看报表

智能调拨规划系统 47.95.198.38:6012

A仓临期滞销

B仓流速极快

生成调拨单: 500盒

极其克制的 MVP：逆向推导流速模型，实现从被动预警向主动驾驶的跨越。

实战案例 2

表面处理智能体：多模态的降维打击

Cam-04 实时视觉语义解析沸腾状态：剧烈

Semantic: Heavy Bubbles

替代老工人经验肉眼“看气泡”

理化传感器联动 47.95.198.38:6013

pH 值波动 (精度 0.01)

Agent 控制输出翻译

VALVE_02_OPEN = 45%

视觉语义判断 (看状态) + 传感器极值 (守底线) = 精准药剂控制

极限环境

智慧渔业：深远海数字底座与边缘 AI

卫星通信 (高延迟/易断连)

Edge AI Node

边缘自治中心

水下视觉资产监测

水质/溶氧传感

gyznsw.cn/solutions/oceanai.html

面对台风断网，边缘计算节点在无云端支援下，实现基础自治与排险。

血泪教训 1

上下文污染与动态 Tool Search

错误：全量注入 API

Token 溢出 / 注意力涣散 / 乱调接口

正确：动态工具检索

意图：查库存并发送邮件

VectorDB 工具匹配... TOP_K = 2

像人类查 API 文档一样，让 Agent 依据意图按需提取极简工具集。

核心壁垒

Harness Engineering (脚手架工程)

“模型不运行系统，系统运行模型。”

边界约束规则

反馈循环与熔断

权限隔离

LLM 引擎

只写 Prompt 解决不了工业问题。决定成败的是围绕模型构建的约束、容错与沙箱执行体系 (Harness)。

物理防线

Sandbox Isolation：AI 时代的防爆服

绝不裸奔执行

允许模型在思考时产生幻觉，但在触碰真实生产库与控制阀门前，必须在完全隔离的镜像环境中预演。

If (Sandbox.Crash) => Trigger.MeltDown();

> DROP TABLE Users;
> SET VALVE = 200%;
> rm -rf /*

SECURE SANDBOX

违规拦截成功

评测范式转移

评估“执行轨迹 (Trajectories)”而非“文本”

旧范式：静态文本输出比对

Input: "计算 12 的阶乘"

Output: "479001600"

得分: 100 (结果一致)

缺点：无法衡量工具使用过程中的安全与效率。

新范式：动态轨迹打分门禁

Start

检索数据库

修改配置文件

End

企图删除日志

最终打分: 0分。
哪怕结果做对了，由于轨迹中试图操作非授权敏感文件，直接否决。

基准测试

Terminal-Bench 2.0 的残酷现实

不建数据化的打分门禁，
Agent 落地就是空谈。

Terminal-Bench 2.0 包含了 89 个极端复杂的真实终端环境任务。即使是最前沿的模型，在真实系统的复杂制约下，成功率依然惨淡。

“永远不要凭感觉来判断你的 Agent 变聪明了没有。”

——必须将轨迹评测深度集成进企业的 CI/CD 流程中。

环境配置配置

多步推理

工具链调用

文件操作

权限越界规避

异常处理恢复

通过率极低

博雅实践工业智能与安全底座