《Smart Agricultural Technology》:Aggressiveness Trait Identification in Portunus trituberculatus via a Self-supervised Computational Ethology Framework
编辑推荐:
摘要
三疣梭子蟹(Portunus trituberculatus)的高密度养殖受到攻击行为的严重影响,导致损伤和同类相食。尽管其具有生态和经济重要性,但攻击性的评估目前仍普遍依赖于人工观察和主观阈值,无法捕捉到行为特征的高维度和连续性本质。为此,研究人员提出
摘要
三疣梭子蟹(Portunus trituberculatus)的高密度养殖受到攻击行为的严重影响,导致损伤和同类相食。尽管其具有生态和经济重要性,但攻击性的评估目前仍普遍依赖于人工观察和主观阈值,无法捕捉到行为特征的高维度和连续性本质。为此,研究人员提出了一种基于深度学习的自监督计算行为学框架,用于从行为数据中进行自动化、客观的攻击性表型鉴定。该框架集成了一种无数据增广的自监督表征学习策略与概率聚类方法,从而能够在没有预定义标签或阈值的情况下推断内在的行为相似性。将此方法应用于镜面测试行为数据,研究人员鉴定出一个稳定的三元攻击性人格结构,这对甲壳类动物行为研究中常用的二元鉴定范式提出了挑战。重要的是,所鉴定表型的生物学相关性通过成对对抗性竞赛实验进行了独立评估:在测试的所有方法中,本框架在攻击性水平间实现了统计学上显著的分离(P?<?0.05)。这些结果表明,在本实验条件下,三疣梭子蟹的攻击性更适宜表示为一种多水平的人格特征,而非严格的二元属性。本研究框架为精准水产养殖中的自动化攻击性鉴定提供了一个稳健的定量工具,并展示了计算方法如何有意义的与实验行为学相结合。
一、 研究背景与动机
三疣梭子蟹是中国重要的水产养殖经济物种。然而,在流行的高密度池塘养殖模式下,高频率的个体间攻击性互动导致了严重的死亡率(可低于5%)和个体伤残(特别是螯足自切),造成了巨大的经济损失。尽管物理隔离(如个体养殖笼)可以部分缓解攻击行为,但成本高昂且难以规模化实施。因此,从行为特征层面降低攻击性是从根本上解决此挑战的途径。这亟需一种非侵入性、可扩展的方法,以便在早期识别出高攻击性表型。攻击性在甲壳动物中是核心人格特征之一,具有时间稳定性,是选育和管理的可行目标。然而,标准化、客观、可扩展的攻击性评估方法的缺乏,限制了相关研究的可比性和遗传改良计划的实施。
镜面测试已成为量化螃蟹攻击性的常用工具。但现有研究通常依赖人为设定的阈值(如经验、均值、等分法)将个体分类为少数几个离散的攻击性水平,这隐含地将其视为低维、离散可分的特征,可能掩盖行为变异的连续本质。近期研究试图应用机器学习方法(如K-Means)来缓解这些限制,但面临三个基本问题:1)对高维原始行为特征进行直接聚类,可能无法捕捉潜在的行为语义和复杂的特征间依赖性;2)基于质心的算法依赖于球形方差等限制性假设,与行为学数据(常呈现稀疏、零膨胀、多峰分布)不相容;3)需预先指定聚类数目K,重新引入了主观性。更重要的是,这类数据驱动聚类是否对应真实的攻击性互动差异,通常缺乏独立的生物学验证。
为解决上述挑战,本研究旨在构建一个自监督计算行为学框架,用于实现三疣梭子蟹攻击性表型的客观鉴定。
二、 关键技术方法概述
本研究框架为两阶段流程,其概览见论文图1。首先,是动态邻域对比学习(Dynamic Neighborhood Contrastive Learning, DNCL)阶段。这是一种无需数据增广的自监督表征学习方法。其核心思想是,将原始行为特征空间(8维)中的欧氏距离作为伪监督信号,指导一个编码器(Encoder)将数据映射到一个具有区分性的、保留潜在行为语义的嵌入空间。DNCL通过一个k-Top记忆库动态维护每个样本的候选正例(最近邻)和负例(最远邻)列表,并采用自适应课程策略(热身阶段使用易样本,收敛后切换到难样本)进行训练,以防止模型坍塌。编码器采用多层感知机实现。其次,是概率聚类阶段。研究人员采用高斯混合模型对学习到的嵌入进行软聚类,并利用一种新的综合聚类分数(Holistic Clustering Score, HCS),结合卡林斯基-哈拉巴斯指数、戴维斯-波尔丁指数和轮廓系数,客观、自动化地确定最优的攻击性水平数量(K)。最后,通过一个基于高置信度样本的GMM重拟合步骤,对聚类结果进行优化,以消除边界样本的干扰,得到最终的攻击性表型鉴定结果。研究的样本队列来源于中国山东青岛某蟹场的1012只健康、处于蜕皮间期的雄性三疣梭子蟹,其行为数据通过20分钟的标准化镜面测试获取。
三、 研究结果
1. 行为数据统计分析与分布特征
通过对1012只三疣梭子蟹的8个行为指标(威胁展示次数与持续时间、撤退次数、攻击次数、接近次数、僵直持续时间与次数、移动距离)进行描述性统计(论文表1)和分布可视化(论文图3),研究人员发现数据呈现出显著的非正态性。具体表现为:计数型特征和移动距离呈现出强烈的右偏(零膨胀)分布;而持续时间型特征(威胁展示持续时间和僵直持续时间)则显示出明显的双峰结构。这些复杂的几何特性对传统的基于质心的聚类方法(如K-Means)构成了挑战,从而验证了采用概率模型(GMM)的必要性。
2. 框架鉴定结果
应用所提出的框架对行为数据进行分析,最优HCS分数对应的模型鉴定出三个攻击性水平(K=3)。这挑战了甲壳类行为研究中常见的二元(高/低)鉴定范式,表明在实验条件下,三疣梭子蟹的攻击性可能更适合用多水平人格特征来描述。
3. 评估与验证
3.1. 定量比较
研究人员将所提框架与K-Means、凝聚聚类和谱聚类等基线方法进行了比较。在轮廓系数、戴维斯-波尔丁指数和卡林斯基-哈拉巴斯指数这三个标准聚类质量指标上,所提框架均取得了最优或极具竞争力的结果,证明其在嵌入空间中产生了更好的聚类结构。
3.2. 生物学验证
为了确保鉴定结果的生物学意义,研究进行了独立的验证。研究人员随机选取了67只螃蟹,进行了成对对抗性竞赛实验。随后,使用置换多元方差分析(PERMANOVA)来评估不同聚类方法所得到的表型标签,是否能显著解释实际对抗性竞赛行为数据(Z-score标准化后)的方差。分析结果显示,在测试的所有方法中,所提框架产生的分组在对抗性行为上表现出最显著的统计学差异(P?<?0.05),其F统计量和R2值也最高。这表明,本框架鉴定出的攻击性水平,与实际个体在真实对抗互动中的行为差异具有最强的关联性,验证了其生物学相关性。
四、 讨论与结论
本研究成功开发并验证了一个用于三疣梭子蟹攻击性表型自动鉴定的自监督计算行为学框架。该框架的创新性在于:1)提出了一种无需人工标注和数据增广的自监督表征学习方法,直接从原始数据中学习行为语义;2)采用概率聚类模型(GMM)并结合综合指标(HCS)自动确定表型水平,避免了主观阈值设定;3)通过独立的对抗性实验对鉴定结果进行了严格的生物学验证。
研究的核心结论是,在本实验条件下,三疣梭子蟹的攻击性呈现出稳定的三元人格结构,而非传统认为的简单二元划分。这为理解甲壳动物的行为复杂性提供了新的视角。
所提出的框架不仅是一个描述性工具,更提供了一个可扩展、非侵入性的表型鉴定工具,可直接支持水产养殖中的遗传改良(如选育低攻击性品系)和智能化管理(如早期识别和优化分群)。该框架的方法学设计(DNCL + 概率聚类 + 独立验证)也为未来其他动物系统的自动化行为表型鉴定提供了参考基础,前提是建立物种特异的行为谱和独立验证数据集。论文最终发表在《Smart Agricultural Technology》期刊上。