CHAPTER 04

博雅实践
工业智能与安全底座

告别纯理论,展示 Agent 在零容错实体业务中的真实落地与防线构建

容错率为零

工业现场不相信大模型的“奇迹”,只相信绝对的控制。

互联网:写错一行代码可以回滚。
实体业务:关错一个阀门就是物理灾难。

数字底座

博雅工业智能算网与数字员工矩阵

ai.gyznsw.cn

算网调度池

GPU 集群 Alpha98% 活跃
边缘计算节点 B在线

数字员工队列

排程调拨专员
处理中...
产线监控网关
挂机监听
从“被动调用 API”到“主动编排数字员工矩阵”。
架构剖析

底层依赖:双路记忆与数字员工四重分身

时序数据库 (TSDB)

毫秒级传感器心跳、实时波动

向量数据库 (Vector DB)

跨越十年的历史工单与图纸

反内耗:严格隔离四重身份

架构副驾

全局意图理解与任务链拆解规划

清洗专员

权限降级模型,对冲传感器漂移与高频噪音

防火墙

智能 QA (独立网关)

具备“敌意”视角,无情拦截违规、越权指令

AIOps 运维中枢

唯一拥有物理执行权,受最终人工审批约束

实战案例 1

医药 ERP:从一张截图到一个闭环系统

Legacy_ERP_Export.xls / 截图识别
临期警报
被动:肉眼看报表
智能调拨规划系统 47.95.198.38:6012
A仓临期滞销
B仓流速极快
生成调拨单: 500盒
极其克制的 MVP:逆向推导流速模型,实现从被动预警向主动驾驶的跨越。
实战案例 2

表面处理智能体:多模态的降维打击

Cam-04 实时视觉语义解析 沸腾状态:剧烈
Semantic: Heavy Bubbles

替代老工人经验肉眼“看气泡”

理化传感器联动 47.95.198.38:6013
pH 值波动 (精度 0.01)
Agent 控制输出翻译
VALVE_02_OPEN = 45%
视觉语义判断 (看状态) + 传感器极值 (守底线) = 精准药剂控制
极限环境

智慧渔业:深远海数字底座与边缘 AI

卫星通信 (高延迟/易断连)
Edge AI Node
边缘自治中心

水下视觉资产监测

水质/溶氧传感
gyznsw.cn/solutions/oceanai.html

面对台风断网,边缘计算节点在无云端支援下,实现基础自治与排险。

血泪教训 1

上下文污染与动态 Tool Search

错误:全量注入 API
Token 溢出 / 注意力涣散 / 乱调接口
正确:动态工具检索
意图:查库存并发送邮件
VectorDB 工具匹配... TOP_K = 2

像人类查 API 文档一样,让 Agent 依据意图按需提取极简工具集。

核心壁垒

Harness Engineering (脚手架工程)

“模型不运行系统,系统运行模型。”

边界约束规则
反馈循环与熔断
权限隔离
LLM 引擎
只写 Prompt 解决不了工业问题。决定成败的是围绕模型构建的约束、容错与沙箱执行体系 (Harness)
物理防线

Sandbox Isolation:AI 时代的防爆服

绝不裸奔执行

允许模型在思考时产生幻觉,但在触碰真实生产库与控制阀门前,必须在完全隔离的镜像环境中预演。

If (Sandbox.Crash) => Trigger.MeltDown();
> DROP TABLE Users;
> SET VALVE = 200%;
> rm -rf /*
SECURE SANDBOX
违规拦截成功
评测范式转移

评估“执行轨迹 (Trajectories)”而非“文本”

旧范式:静态文本输出比对

Input: "计算 12 的阶乘"
Output: "479001600"
得分: 100 (结果一致)
缺点:无法衡量工具使用过程中的安全与效率。

新范式:动态轨迹打分门禁

Start
检索数据库
修改配置文件
End
企图删除日志
最终打分: 0分。
哪怕结果做对了,由于轨迹中试图操作非授权敏感文件,直接否决。
基准测试

Terminal-Bench 2.0 的残酷现实

不建数据化的打分门禁,
Agent 落地就是空谈。

Terminal-Bench 2.0 包含了 89 个极端复杂的真实终端环境任务。即使是最前沿的模型,在真实系统的复杂制约下,成功率依然惨淡。

“永远不要凭感觉来判断你的 Agent 变聪明了没有。”

——必须将轨迹评测深度集成进企业的 CI/CD 流程中。

环境配置配置
多步推理
工具链调用
文件操作
权限越界规避
异常处理恢复
通过率极低

讲者话术 (Speaker Notes)

加载中...

1/12