
-
生物通官微
陪你抓住生命科技
跳动的脉搏
混合推理在制造业中的感知、解释与自主行动中的应用
《Nature Communications》:Hybrid reasoning for perception, explanation, and autonomous action in manufacturing
【字体: 大 中 小 】 时间:2026年05月20日 来源:Nature Communications 15.7
编辑推荐:
摘要工业过程必须在不可预测的环境中稳定运行,在这种环境中,错误不仅代价高昂,而且难以检测。基于人工智能的控制系统为解决这一问题提供了一条途径,但通常依赖于大规模、带有标签的数据集,这限制了它们在数据稀缺、环境多变情况下的泛化能力。基础模型虽然能够实现更广泛的推理和知识整合,但在工
工业过程必须在不可预测的环境中稳定运行,在这种环境中,错误不仅代价高昂,而且难以检测。基于人工智能的控制系统为解决这一问题提供了一条途径,但通常依赖于大规模、带有标签的数据集,这限制了它们在数据稀缺、环境多变情况下的泛化能力。基础模型虽然能够实现更广泛的推理和知识整合,但在工程应用中仍难以达到所需的定量精度。在这里,我们提出了“通过混合专家知识和推理进行生产控制与解释”(Control and Interpretation of Production via Hybrid Expertise and Reasoning,简称CIPHER)框架:这是一个专为工业感知、解释和控制设计的系统级视觉-语言-动作(Vision-Language-Action,VLA)框架。CIPHER结合了过程专家对系统状态的定量描述,以及基于过程物理原理和知识的检索增强型推理机制。这种混合设计使得系统能够很好地泛化到未见过的数据情况,使代理能够解释文本或视觉输入、说明其决策,并在无需明确监督的情况下自主生成精确的机器指令。在本研究中,CIPHER已在多个制造系统中得到应用,展示了精确、具备上下文感知能力且透明的控制效果,具有在实际工业环境中部署的潜力。