容错率与鲁棒性测试
概述
“四维试金石"方法的第三维度。判断一项技术能否处理"长尾的极端情况”(Corner Cases),而不仅仅是在"实验室无菌环境"下有效。
判断标准
真突破特征
- 在疲惫、出错、面对混乱数据时依然能稳定输出
- 不需要完美的输入就能给出有价值的输出
- 案例:AI代码助手能根据上下文准确推断意图并补全烂代码
炒概念特征
- 只在受控的演示环境中有效
- 现实场景中光照变化、物品摆放偏移、遇到未曾见过的障碍物即宕机
- 案例:具身智能机器人在非结构化真实物理世界中鲁棒性不足
应用场景
适用于评估机器人、自动驾驶、工业自动化等需要在真实物理世界中运行的技术,以及任何声称"改变工作方式"的软件工具。