约束工程

约束工程

约束工程

约束工程是指在资源、隐私、续航、合规等现实约束下进行AI工程化的能力。这是[[系统能力]]在受限环境下的具体体现,也是[[五次能力跃迁]]中第一层"能用"的核心能力。

典型约束

  • 计算资源:模型不能一直占着内存,要按需懒加载
  • 设备差异:旧设备只能跑4-bit量化,新设备适合8-bit
  • 上下文窗口:不能无限堆,只能靠滑动窗口和语义切块保留最相关内容
  • 电量管理:电量低时控制推理频率,把不关键的任务延后
  • 数据隐私:本地数据必须加密保存,是否同步到云端由用户决定

工程实践

  • 量化部署技术
  • 滑动窗口上下文管理
  • 语义切块与检索
  • 按需懒加载
  • 本地加密存储

相关概念

  • [[系统能力]] — 约束工程是系统能力的核心组成部分
  • [[五次能力跃迁]] — 约束工程对应第一层跃迁
  • [[算力下沉]] — Physical AI时代约束工程的重要性上升
  • [[physical-ai]] — 边缘设备上的AI部署
分享到