神经符号架构
神经符号(Neuro-Symbolic)架构是一种结合神经网络(如LLM)的灵活性与符号系统(如经典控制算法)的确定性的混合方法。在[[Dimensional OS]](DimOS)中,这是其核心技术路线。
分层架构
DimOS采用三层分层架构:
- 高层:LLM Agent(如[[OpenClaw]]/Claude)负责推理、规划、工具调用。它看到相机图像、查询空间记忆,输出自然语言意图或MCP技能调用。
- 中层:物理技能库,包含
pick-and-place、grasp、relative_move等确定性控制算法,成功率99%以上。 - 底层:硬件抽象层,连接Unitree、xArm、DJI等各类机器人硬件。
高层与中层之间通过[[MCP协议]]通信。
与纯VLA路线的对比
纯VLA(Vision-Language-Action)模型如RT-2、Octo虽然能处理复杂灵巧操作,但缺乏护栏、可观测性差、生产就绪度还需2-4年。神经符号架构的优势在于:
- 可靠性:中层确定性控制算法提供99%+的成功率
- 可观测性:每步操作都有实时遥测反馈
- 生产就绪:今天就能部署,无需等待大模型完美
- 可升级性:未来随着VLA成熟可以无缝升级
核心主张
神经符号路线比纯端到端更务实——今天就能生产级部署,明天随着VLA成熟无缝升级。这是当前实现生产级具身智能的最优解。