木结构建筑(WFC)是北美最常用的建筑方法之一,占单户住宅的90%,这得益于其成本效益、可持续性和对不同建筑设计的适应性[1]。传统的WFC预制工艺严重依赖人工劳动,工人需要操作多种工具进行切割和安装材料。这一过程需要大量的体力劳动和高水平的技能[2]。此外,与制造业相比,建筑行业长期以来一直面临着生产率低的问题[3]。
将机器人技术引入制造业显著提高了生产率和效率,这一转变被视为建筑行业值得效仿的典范[4]。然而,机器人在建筑领域的应用仍然有限。其中一个关键原因是两个行业之间的根本差异。制造业受益于大规模标准化,而建筑行业则以高度定制和小批量项目为特点[5]。这一独特特性使得难以应用那些在制造业中成功实现自动化的策略[6]。
此外,定制设计的高几何变异性以及天然WFC组件的固有几何偏差(见第2.3节和图1)进一步增加了在建筑中集成机器人的复杂性[1]。制造业中的机器人自动化通常依赖于离线编程,其中工业机器人手臂通过基于点的指令手动学习精确的重复动作[7]。这些机器人在受控环境中操作,以固定且可重复的6-DOF姿态(X、Y、Z、Rx、Ry、Rz)拾取物体并将其放置到预定义的组装位置[8]。然而,这种方法在WFC中并不实用,因为设计异质性和材料引起的偏差需要频繁重新编程和校准,使得传统的离线编程不再适用。
除了设计层面的变异性外,WFC还受到天然木立柱固有尺寸变异性的限制。定量公差分析表明,木结构组件只能承受有限的几何偏差才能保持结构上的可接受性。例如,WFC中的立柱定位和墙体几何公差通常限制在0.32–0.63厘米(1/8–1/4英寸)范围内,包括横向和纵向立柱的位置、3.04米(10英尺)跨度内的墙体垂直度偏差,以及墙体弯曲和方正度的限制,这些都在标准的木结构公差分析中有规定[9]。这些公差限代表了功能性木结构建筑可接受偏差的上限。然而,当高度定制设计和天然木材材料引起的几何变异性未被明确感知和补偿时,离线编程的机器人执行很容易使实际组装超出这些公差限制。最近关于机器人木材墙预制的研究表明,天然材料的缺陷(如弯曲和扭曲)引入了几何不确定性,这些不确定性无法通过静态离线编程可靠处理,通常需要额外的排序或自适应策略来实现可行的组装[10]。
来自近期工业案例研究的定量证据进一步凸显了这一限制的严重性。例如,从BIM模型中手动提取几何信息并进行离线机器人编程来完成墙体框架任务,据报道每0.3米(1英尺)的墙体需要6.07分钟,对于涉及268英尺(75.6米)墙体的中等规模案例研究,总共需要1626.76分钟(约27小时),即使报告的工作仅限于软件层面的规划,不包括机器人的现场教学或执行[11]。重要的是,这些研究还表明,即使有准确的数字模型,微小的施工偏差和放置不确定性仍然需要在实际执行过程中进行手动审查和调整,以避免碰撞或错位。关于机器人操作的实证研究进一步表明,仅依赖CAD/合成训练数据时,抓取成功率会降至46.7%,而当结合真实视觉反馈时,成功率可提升至86.7%[12]。
为了解决这些挑战,自适应控制方法变得至关重要,因为它们提供了感知性的实时反馈,使机器人手臂能够动态调整其行为。实现这种自主性需要两个关键组件:(1)基于视觉的感知能力,能够提供每个独特组件和环境几何的精确6-DOF对象姿态作为反馈信号;(2)自适应控制能力,能够自动规划无碰撞的运动,减少对人工编程的依赖。然而,这两个组件都面临重大挑战。现有的姿态估计方法通常依赖于CAD模型,主要在非工业数据集上进行训练,并且经常忽略传感器噪声(见2.2节对象姿态估计挑战、2.3节RGB-D输入精度限制和基准标准差距)。同时,自适应控制系统在WFC研究中的探索仍然有限(见第2.1节),而从制造业继承而来的工业机器人手臂(例如ABB、KUKA、FANUC)缺乏对自主运动规划的本地支持,而是依赖于手动编程的轨迹[11]。因此,实现真正的自主自动化需要准确的无模型姿态估计和实时自适应运动规划的进步,这两者对于自主机器人建筑来说是不可或缺的。
因此,本文结合了一种基于几何先验的实时6-DOF姿态估计技术和在线机器人控制平台,以支持基于视觉的、环境感知的自适应运动规划,适用于WFC。该方法利用所提出的姿态估计算法,无需完整的CAD模型或预生成的对象级3D重建,直接从RGB-D输入中提取姿态和几何信息。几何先验仅限于用户指定的(实际测量的)立柱截面尺寸,并作为物理约束使用,而不是显式的CAD模型或完整形状表示。6-DOF姿态估计实现了毫米级的精度,同时适应WFC的变化几何形状和定制设计,证明了在没有完整模型配准的情况下对天然木材变异性的鲁棒性。通过结合这种实时反馈,系统能够实现自适应机器人控制,以应对高度定制和小批量WFC项目以及几何变异性的挑战,减少对劳动密集型离线编程和手动目标扫描的依赖。
为了评估所提出的6-DOF算法的性能,本文进一步开发了一个高分辨率、精确标注的基准数据集,专门针对典型的WFC场景,解决了该领域数据不足的问题(见第2.3节)。使用该数据集,所提出的算法与多种现有技术进行了全面对比,一致显示出更高的准确性和鲁棒性。最后,通过在实际WFC条件下的木立柱抓取实验验证了完整的视觉驱动自适应控制框架的实用性。