约束工程
约束工程是指在资源、隐私、续航、合规等现实约束下进行AI工程化的能力。这是[[系统能力]]在受限环境下的具体体现,也是[[五次能力跃迁]]中第一层"能用"的核心能力。
典型约束
- 计算资源:模型不能一直占着内存,要按需懒加载
- 设备差异:旧设备只能跑4-bit量化,新设备适合8-bit
- 上下文窗口:不能无限堆,只能靠滑动窗口和语义切块保留最相关内容
- 电量管理:电量低时控制推理频率,把不关键的任务延后
- 数据隐私:本地数据必须加密保存,是否同步到云端由用户决定
工程实践
- 量化部署技术
- 滑动窗口上下文管理
- 语义切块与检索
- 按需懒加载
- 本地加密存储
相关概念
- [[系统能力]] — 约束工程是系统能力的核心组成部分
- [[五次能力跃迁]] — 约束工程对应第一层跃迁
- [[算力下沉]] — Physical AI时代约束工程的重要性上升
- [[physical-ai]] — 边缘设备上的AI部署