#祛魅 #务实 #工程视角

AI Agent 驱动下的
企业进化实践与分享

告别“玩具AI”,聚焦真实业务落地

第一章:现场摸底与技术认知体系的重构

对 AI 的浪漫幻想

“许愿机模式”、“无所不能的魔法棒”

> Agent initialization started...

> Fetching tools...

> Error: Context window exceeded.

> Error: Hallucination detected in module 4.

回到代码与工程的现实

Q1 · 问卷暖场

能够一眼认出以下超过一半的人 → 请举手

人物 1

Geoffrey Hinton

人物 2

Yann LeCun

人物 3

Yoshua Bengio

人物 4

Ilya Sutskever

人物 5

Sam Altman

人物 6

Demis Hassabis

人物 7

Dario Amodei

人物 8

Fei-Fei Li

人物 9

Jensen Huang

人物 10

Andrew Ng

人物 11

Jeff Dean

人物 12

John Jumper

人物 13

Richard Sutton

按方向键 → 触发动画演示
Q2 · 问卷暖场

以下 8 个概念,不用思考马上全部明白 → 请举手

LLM

大语言模型

Token

语言的基本单元

Context

模型的记忆窗口

Prompt

与 AI 的沟通语言

Tool

AI 可调用的外部能力

MCP

模型上下文协议

Agent

自主决策执行循环

Agent Skill

可复用的 Agent 能力

Q3 · 问卷暖场

同时拥有以下三个付费账号,且都用到过 Token 耗尽 → 请举手

Gemini

Google DeepMind

• Google 旗舰 AI 模型

• 多模态推理 · 深度检索

• 支持超长上下文窗口

Claude Code

Anthropic

• Anthropic 旗舰编程 AI

• 深度代码理解与生成

• 目前最受工程师推崇

ChatGPT / o1

OpenAI

• OpenAI 旗舰对话 AI

• 最广泛用户基础

• 插件与 API 生态完备

三个账号都用到 Token 耗尽,意味着你已经把 AI 当成了真正的工作伙伴,而不是新奇玩具。
Q4 · 问卷暖场

同时使用 2 个以上模型,分工明确迭代过产品 → 请举手

设计

Claude / GPT-4o

需求拆解

界面原型

架构设计

用户旅程

代码

Claude Code / Cursor

功能实现

接口对接

单元测试

性能优化

验证

Gemini / GPT-4o

代码审查

逻辑校验

边界测试

安全扫描

这就是真正意义上把 AI 当成开发团队协作工具,而非辅助打字的工具
Q5 · 问卷暖场

完全不用电脑,通过手机控制电脑完成过项目 → 请举手

手机端
语音 / 文字指令
AI Agent 解析
远程执行代码
项目完成

为什么这个问题重要?

这意味着 AI Agent 已经可以完全接管 PC 工作流,你只需要给出目标。

Claude Code + 远程 SSH + 手机终端,可以在任何地点完成复杂开发任务。

这是 Autopilot(自动驾驶) 模式真正落地到个人生产力的体现。

下一步: 工业现场也将如此——工程师只需手机审批,AI 控制机器。

历史坐标系

AI 发展的 6 大阶段全景图

Rule-based
规则引擎
Machine Learning
特征工程
Deep Learning
深度学习
LLM
基础模型
Copilot
副驾时代
Agent
智能体自治
架构剖析

企业 AI 落地的 8 层技术栈 (基础设施)

层级 8:应用交付层
层级 7:Harness (编排与脚手架)
层级 6:工具与协议层 (MCP)
层级 5:知识增强层 (RAG)

层级 4:长短期记忆 (TSDB / Vector DB)

向量检索、图数据库、对话历史存储

层级 3:数据流水线 (Data Pipelines)

脏数据清洗、ETL、非结构化数据解析

层级 2:基础模型层 (LLM)

闭源 API (GPT-4) / 开源微调 (Llama 3)

层级 1:算力基座 (GPU/调度)

云服务、私有算力池、K8s 调度

核心壁垒

企业 AI 落地的 8 层技术栈 (核心业务层)

层级 8:应用交付层

UI/UX, 企微/钉钉集成, API Gateway

最核心壁垒

层级 7:Harness (编排与脚手架)

多 Agent 协同、工作流调度、熔断与降级机制

层级 6:工具与协议层 (MCP)

打破信息孤岛的企业级标准接口协议

层级 5:知识增强层 (RAG)

消灭大模型幻觉,基于企业专有知识库生成

层级 4:长短期记忆 (TSDB / Vector DB)
层级 3:数据流水线 (Data Pipelines)
层级 2:基础模型层 (LLM)
层级 1:算力基座 (GPU/调度)
核心组件

落地核心三剑客:RAG、MCP 与 Agent

Agent

统筹大脑,感知并完成闭环

RAG

外挂记忆
消灭幻觉提供事实

MCP

AI 的 USB-C
接管四肢与协议

第一章小结:核心矛盾

天天喊着被 Agent 颠覆
却还在用基于规则的古法编程
套壳脆弱的概率性智能体。

旧架构 (马车)

新引擎 (高铁车厢)

不重构技术栈,就无法承接 Agent 时代的红利。

CHAPTER 02

智能体浪潮下的
商业模式重塑

基于顶级资本研报框架,拆解传统 SaaS 的危机与 AI 时代新范式

商业演进

范式转移:从 Copilot 到 Autopilot

过去:售卖过程 (Copilot)

SaaS 订阅账单
  • 基础平台费$99/月
  • 50个员工坐席$500/月
  • 高级功能包$199/月
客户:我买了一堆工具,还得自己干活?
已淘汰

现在:直接交付成果 (Autopilot)

AI 员工执行中...

自动处理客户工单与退款

✅ 任务完成:成功解决 50 笔退款。
按结果结算 (50笔) $25.00
从“售卖提高效率的工具”向“直接交付工作成果”演变。
收费模式

商业化终局:Service-as-a-Software

传统 SaaS 公司

售卖记账软件

$99 / 月

包含 5 个账号,支持自定义报表


客户需自己录入数据

客户需自己核对发票

客户需自己承担算错的责任

新型 Agent 公司

售卖“财务服务”

降维打击
$5 / 份报表

上传乱账,直接出表


AI 自动解析照片与 PDF

交叉验证银行流水

交付最终审计合规的税务表

客户买的不是系统,是一份合规的结果。

水下金矿

战略猎场:红杉资本 1:6 法则

$1 SaaS 软件支出
SEA LEVEL ───────── ───────── 认知分界线
$6 服务外包与实施成本
  • • IT 实施交付团队
  • • 业务流程外包 (BPO)
  • • 人工客服中心
  • • 数据清洗专员
目前绝大多数 AI 还在卷这 $1 的水上市场,帮人们更好的使用软件。
Agent 的终极猎场 吞噬这庞大的 $6 隐藏人力支出,彻底重构企业成本结构。
分工边界

人机协作的边界:二维分析矩阵

Judgment
判断力 (伦理/商业风险)
Intelligence
智能 (处理/分析/生成能力)
人类高管
1% 的关键定夺
AI Agent
99% 的高智商苦力
传统软件
落地战术

落地切入策略:组织的隐性阻力

在企业内推行 AI,阻力最小的路在哪?

内部裁员重组

  • 极高的政治阻力
  • 部门墙与消极怠工
  • 员工担心饭碗不配合
💣

替换外包供应商

  • 立竿见影的财务降本
  • 内部业务零冲突
  • 动的是外部人的奶酪
冰山剖析 1/3

核心价值拷问:你真的改变基本面了吗?

AI 文本润色插件

“用酷炫的 UI,把点击鼠标三次的操作,变成说一句话。”

TOY
纯属玩具
企业不为“微小体验优化”买单,只为 产能翻倍 / 成本减半 买单。
冰山剖析 2/3

高昂的隐性数据成本

企业历史数据遗留

脏、乱、缺、旧

现实的输入端
极其昂贵的人力清洗

大模型 / RAG 引擎

需要结构化“黄金上下文”

理想的模型端

整理企业遗留脏数据的隐性费用,往往是调用大模型 API 费用的 10倍 以上。

冰山剖析 3/3

安全与合规的底线防线

🚫 ACCESS DENIED 🚫 ACCESS DENIED 🚫

效率提升是加分项,物理失控与数据泄露是毙命项

(金融、医疗、重工业对幻觉和权限越界的容忍度为 0)

效能爆炸

系统级杠杆:估值模型被彻底改写

传统 SaaS 时代
(2015-2023)

10-50 人团队
创造千万营收

AI Agent 时代
(Now)

+
微型团队指挥机器军团
撬动同等产出
终结孤岛

SaaS 工具链的消亡

中枢 Agent

过去:打工人用 20 种碎片化工具拼凑协同。
现在:Agent 直接跨系统吞吐所有数据。

第二章小结:认清新战场

不要在旧战场打新战争。

抢占庞大的服务外包市场,
停止售卖工具,直接交付最终结果。

CHAPTER 03

组织架构与工作流的
深层演进

当 AI 写代码比人类写 PRD 还要快,传统产研协作模式面临崩塌

致命拥堵

令人窒息的局部效率陷阱

传统大公司的功能交付时间轴 (Value Stream Map)

PRD撰写与多轮评审 耗时:2 周
AI 编码 极速压缩:3 小时
等待测试资源与排期 耗时:1.5 周
灰度发布审批 耗时:1 周

悖论: AI 让代码 3 小时写完,但跨部门的对齐与评审流程依然卡住 2 周。
局部生产力的暴增,只是把拥堵转移到了下游。

模式崩塌

长周期瀑布流的末日

需求调研 (1个月)
架构设计 (2周)
研发与联调 (1个月)
测试与上线 (2周)
OpenAI 发布新接口,你的架构瞬间归零!

当底层系统能力以“周”为单位进化时,
三个月的对齐周期是对生产力的犯罪

岗位危机

传统 PM 与 PRD 的消亡危机

V4.0 PRD.doc
The Eraser
基于文本难以描述非线性 AI 交互
你好,我是智能助手。
一键生成闭环
用可交互原型代替千字文档
物种进化

新物种:Product Engineer (PE) 崛起

商业嗅觉
AI 编排引擎
后端架构
全栈交付
UX/UI 审美
数据分析

边界的彻底消亡

PM 与 RD 的职能融合。PE 不是全栈工程师,而是“全链路产品主理人”

  • 懂商业,知痛点不盲目堆砌代码,直接对指标负责。
  • AI 军团统帅熟练运用 Claude/Cursor 生成生产级应用。
  • 端到端交付跳过沟通内耗,一人完成发现到上线的闭环。
硅谷激进派

标杆案例:PostHog 的极速运转逻辑

PostHog

拒绝代理层:直接倾听炮火

真实客户反馈 痛点 / 业务数据
传统 PM
Product Engineer 直接背负商业指标
直接赋权:超高速试错闭环
原生文化

Anthropic 的“吃狗粮”文化:原型即 PRD

不做冗长假设,拒绝空对空争论。用 AI 秒级生成,让数据说话。

A
方案 A (对话流)
转化率: 12.5%
B
WINNER
方案 B (画布流)
转化率: 38.2%
C
方案 C (表单流)
转化率: 8.1%
效能核爆

系统级杠杆效应:10 人重构 50 人系统

SaaS 时代 (过去)

50 名员工维系系统
VS

Agent 时代 (现在)

10 名精英指挥编排引擎
终局推演

未来核心人才 1:PE 军团指挥官

指挥官
The Commander

“一个人带领一支多模型 Agent 军队的复合型系统搭建者。”

  • 精准发包能力能将复杂的商业宏观目标,精准拆解为机器可理解、可执行的具体 Prompt 与 Context。
  • 多模型调度熟练编排规划者 (Planner)、编码者 (Coder)、审核者 (Reviewer) 等多 Agent 协同作战。
终局推演

未来核心人才 2:审美与共情者

审美共情者
The Empathizer

“拥有极致用户同理心与艺术直觉,负责定义产品的『灵魂』。”

  • 真实的“痛感”AI 没有肉身,无法真正共情。只有人能敏锐捕捉真实业务场景中那些难以量化的情绪痛点。
  • 最终的品味决断当逻辑代码变得廉价,决定产品生死的不再是功能堆砌,而是美学修养和高级交互体验的判断力。
终局推演

未来核心人才 3:合规边界的“成年人”

边界守护者
The Guardian

“负责架构底线、数据安全审核、隐私隔离与灾难兜底的『成年人』。”

  • 物理与权限防线在 Agent 获得沙箱执行权限时,构建坚不可摧的越权拦截与熔断机制,防止数据库被篡改。
  • 合规与灾难兜底处理 AI 幻觉带来的极端客诉、法律风险,负责在机器失控时按下物理红线停止按钮。
落地战术

国内破局:渐进式重构法则

避免“休克疗法”,
建立创新特种部队。

错误做法:休克疗法

全公司一刀切,强行裁员转型,导致核心业务瘫痪,引发严重的组织对抗。

正确姿势:边缘渗透
  • 剥离一个独立核算的边缘创新小组
  • 赋予最高级 AI 工具权限 (Cursor/Claude)
  • 废除长篇 PRD 考核,改为原型评审制
  • 用特种兵的高效成果倒逼大厂文化同化

CHAPTER 04

博雅实践
工业智能与安全底座

告别纯理论,展示 Agent 在零容错实体业务中的真实落地与防线构建

容错率为零

工业现场不相信大模型的“奇迹”,只相信绝对的控制。

互联网:写错一行代码可以回滚。
实体业务:关错一个阀门就是物理灾难。

数字底座

博雅工业智能算网与数字员工矩阵

ai.gyznsw.cn

算网调度池

GPU 集群 Alpha98% 活跃
边缘计算节点 B在线

数字员工队列

排程调拨专员
处理中...
产线监控网关
挂机监听
从“被动调用 API”到“主动编排数字员工矩阵”。
架构剖析

底层依赖:双路记忆与数字员工四重分身

时序数据库 (TSDB)

毫秒级传感器心跳、实时波动

向量数据库 (Vector DB)

跨越十年的历史工单与图纸

反内耗:严格隔离四重身份

架构副驾

全局意图理解与任务链拆解规划

清洗专员

权限降级模型,对冲传感器漂移与高频噪音

防火墙

智能 QA (独立网关)

具备“敌意”视角,无情拦截违规、越权指令

AIOps 运维中枢

唯一拥有物理执行权,受最终人工审批约束

实战案例 1

医药 ERP:从一张截图到一个闭环系统

Legacy_ERP_Export.xls / 截图识别
临期警报
被动:肉眼看报表
智能调拨规划系统 47.95.198.38:6012
A仓临期滞销
B仓流速极快
生成调拨单: 500盒
极其克制的 MVP:逆向推导流速模型,实现从被动预警向主动驾驶的跨越。
实战案例 2

表面处理智能体:多模态的降维打击

Cam-04 实时视觉语义解析 沸腾状态:剧烈
Semantic: Heavy Bubbles

替代老工人经验肉眼“看气泡”

理化传感器联动 47.95.198.38:6013
pH 值波动 (精度 0.01)
Agent 控制输出翻译
VALVE_02_OPEN = 45%
视觉语义判断 (看状态) + 传感器极值 (守底线) = 精准药剂控制
极限环境

智慧渔业:深远海数字底座与边缘 AI

卫星通信 (高延迟/易断连)
Edge AI Node
边缘自治中心

水下视觉资产监测

水质/溶氧传感
gyznsw.cn/solutions/oceanai.html

面对台风断网,边缘计算节点在无云端支援下,实现基础自治与排险。

血泪教训 1

上下文污染与动态 Tool Search

错误:全量注入 API
Token 溢出 / 注意力涣散 / 乱调接口
正确:动态工具检索
意图:查库存并发送邮件
VectorDB 工具匹配... TOP_K = 2

像人类查 API 文档一样,让 Agent 依据意图按需提取极简工具集。

核心壁垒

Harness Engineering (脚手架工程)

“模型不运行系统,系统运行模型。”

边界约束规则
反馈循环与熔断
权限隔离
LLM 引擎
只写 Prompt 解决不了工业问题。决定成败的是围绕模型构建的约束、容错与沙箱执行体系 (Harness)
物理防线

Sandbox Isolation:AI 时代的防爆服

绝不裸奔执行

允许模型在思考时产生幻觉,但在触碰真实生产库与控制阀门前,必须在完全隔离的镜像环境中预演。

If (Sandbox.Crash) => Trigger.MeltDown();
> DROP TABLE Users;
> SET VALVE = 200%;
> rm -rf /*
SECURE SANDBOX
违规拦截成功
评测范式转移

评估“执行轨迹 (Trajectories)”而非“文本”

旧范式:静态文本输出比对

Input: "计算 12 的阶乘"
Output: "479001600"
得分: 100 (结果一致)
缺点:无法衡量工具使用过程中的安全与效率。

新范式:动态轨迹打分门禁

Start
检索数据库
修改配置文件
End
企图删除日志
最终打分: 0分。
哪怕结果做对了,由于轨迹中试图操作非授权敏感文件,直接否决。
基准测试

Terminal-Bench 2.0 的残酷现实

不建数据化的打分门禁,
Agent 落地就是空谈。

Terminal-Bench 2.0 包含了 89 个极端复杂的真实终端环境任务。即使是最前沿的模型,在真实系统的复杂制约下,成功率依然惨淡。

“永远不要凭感觉来判断你的 Agent 变聪明了没有。”

——必须将轨迹评测深度集成进企业的 CI/CD 流程中。

环境配置配置
多步推理
工具链调用
文件操作
权限越界规避
异常处理恢复
通过率极低

CHAPTER 05

2026 AI 工程师
生存指南与讲座总结

指明职业发展的高阶路径,跨越“套壳应用”的死亡陷阱

认知觉醒

2026 工程师生存研判:别再建套壳了

“Tutorial Hell is a comfortable grave.”

教程地狱是一个舒适的坟墓。不要再做容易被 API 原生吞噬的通用 Wrapper。

Wrappers (套壳应用)

Prompt UI
PDF Chat
90% 的开发者拥挤在此
15万美金
薪资断层与鸿沟

System Architecture

编排 (Orchestration) 记忆 (Memory) 本地推理 (Local Inference)
不可替代的核心资产
能力跃迁 1/5

入门级:基于小模型 (SLM) 的离线手机应用

12:00
Local Llama-3-8B
4-bit Quantized
RAM: 3.2GB
> API Cost: $0.00
> Privacy: 100% Secured
> Status: Inferencing...

证明能力:边缘计算与资源压榨

在断网、低电量、小内存的极端环境下,实现高可用 AI。

动态量化 (4-bit / 8-bit)大幅压缩模型体积,使其能塞进手机内存。
资源敏感调度按需懒加载模型,针对电量压力动态降频推理。
绝对隐私隔离数据绝不上云,彻底阻断企业级数据泄露风险。
能力跃迁 2/5

中级:自我改进的编码 Agent (Agentic Loop)

Chatbot 等待提示词,Agent 等待目标。区别在于“循环”。


1. Plan (计划)

2. Execute (执行)

3. Test (测试)

4. Reflect (反思)
If Failed
Failure Memory
(失败记忆库)
相似报错检索,绝不二过
能力跃迁 3/5

高级:为视频剪辑打造的多模态 Cursor

User Intent (主观意图)

“让这画面看起来有电影感一点,动作稍微慢一点。”

多模态意图翻译器

Execution Params (底层参数)

> Video.setSpeed(0.8);
> Color.applyLUT('Teal_Orange_Cinematic');
> Visual.addGrain(12%);
> Background.blur(radius=15);
// Edit Decision List generated

将模糊的“主观情感”精准映射为“底层执行参数”。

能力跃迁 4/5

专家级:个人生活 OS 助理 (深度上下文与隐私)

财务流水
健康体检
工作日程
家庭关系

跨越隐私红线的硬核防线

  • 长期知识图谱 (Knowledge Graph) 不再是即用即抛的对话上下文,而是构建理解你深层价值观的关联数据库。
  • 主动预警决策 基于优先级(家庭 > 工作),主动预测你的“过劳风险”并自动拦截非紧急会议。
  • 端侧全盘加密 高度敏感数据强制留在本地芯片运算,构建极致的隐私物理隔离区。
最终 Boss (Final Boss)

大师级:自治企业工作流 Agent

金融级生产管线编排


Orchestrator

监听工单
自愈重试

更新任务
RBAC 鉴权

生产 DB

100% 不可篡改的执行审计日志

Immutable Audit Trail
[2026-04-15 10:01:23] [INFO] Trigger: Slack Alert received. [2026-04-15 10:01:25] [AUTH] RBAC Check: Orchestrator-Role verified. [2026-04-15 10:01:30] [EXEC] Sub-Agent 'Jira-Bot' initiated. [2026-04-15 10:01:35] [WARN] API Timeout on Jira-Node. [2026-04-15 10:01:36] [HEAL] Exponential Backoff triggered (Retry 1/3) [2026-04-15 10:01:40] [INFO] Connection re-established. [2026-04-15 10:01:45] [CRITICAL] Requesting DB write access. [2026-04-15 10:01:46] [SANDBOX] Pre-flight simulation... PASSED. [2026-04-15 10:01:50] [COMMIT] Transaction ID: #98A7F2BC completed.

能够造出具备“防爆自愈 + 高保真溯源”系统的人,是企业疯抢的核心资产。

阶层分化

The brutal truth for 2026: 认清你的位置

可替代的

The Replaceable

写套壳应用 (Wrappers)
1
2
3
4
5

不可解雇的

The Unfireable

交付生产级自治系统

这 5 个实战项目的距离,就是平庸与顶尖的唯一物理鸿沟。

Takeaways

市场奖励交付,而不是学习 (Tutorial Hell)

今晚就去“交付”

  • 选定清单中的 1 个难度匹配的项目,本周末动手。
  • 构建属于你自己的 Harness (隔离沙箱),而不是写漂亮的 Prompt。
  • 公开记录 (Build in public):分享你的架构决策、崩溃复盘与自愈逻辑

Q & A

直面残酷现实,探讨落地死结

感谢聆听

刘伟

工业智能算网

gyznsw.cn

Let's build the Unfireable system.

扫码关注
扫码连接
1 / 58

无讲者话术。