SMOTrojan：一种基于无模型图神经网络（GNN-SMOTE）的自动化硬件木马检测框架，通过合成节点-边数据实现高效检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Microelectronics Journal》：SMOTrojan: A golden model-free GNN-SMOTE framework for automated Hardware Trojan detection via synthetic node-edge synthesis

【字体：大中小】 时间：2026年02月11日 来源：Microelectronics Journal 2.3

编辑推荐：

　　硬件特洛伊木马（HT）检测框架SMOTrojan结合SMOTE oversampling与拓扑保持边合成模块，利用图神经网络（GNN）实现无需金参考模型的节点级HT定位，在17个Trust-HUB基准测试中显著提升TNR（99.99%-99.58%）、TPR（91.02%-94.90%）和F1（94.21%-90.40%）。

刘飞|苏子龙|王森|王成华|崔一军|刘伟强

南京航空航天大学集成电路学院，南京，211106，中国

摘要

硬件木马（HTs）威胁着全球集成电路供应链，但现有的深度学习检测方法仍存在手动特征设计、节点级定位能力有限、对类别不平衡问题的处理依赖启发式方法以及频繁依赖黄金参考设计的问题。本文提出了SMOTrojan，这是一种无需黄金模型的节点级HT检测框架，它将图神经网络（GNNs）与SMOTE技术和保持拓扑的边合成模块结合用于门级网表。SMOTrojan的关键优势在于直接在网表图上进行过采样：在特征空间生成合成的少数（HT）节点，然后根据门类型兼容性、局部输入/输出统计和时序锥局部性自动将其连接到有向无环图中，从而生成平衡且物理上合理的电路。基于这种图增强技术，SMOTrojan提供了一个端到端的流程，从特征提取和节点/边合成到GCN、GAT和GraphSAGE训练，无需任何黄金模型即可实现节点级HT定位，并可集成到面向安全的EDA流程中。在17个Trust-HUB基准测试上的实验表明，SMOTrojan显著提高了HT检测效果，使用GCN、GAT和GraphSAGE分别实现了平均真阴性率（TNR）为99.99%、99.75%、99.58%，真正例率（TPR）为91.02%、94.83%，F1分数为94.21%、90.60%、90.40%。与代表性的HT检测方法相比，SMOTrojan在相似或更高的真阴性率下将F1分数提高了约90%–94%，证明了其作为自动化HT检测和定位的强大且可扩展的解决方案的优势。

引言

随着信息技术的进步，集成电路（ICs）的应用范围显著扩大。然而，芯片设计的全球化也引入了新的攻击向量，硬件电路现在越来越面临硬件木马（HT）攻击的威胁。第三方，如设计公司、代工厂和电子设计自动化（EDA）工具，可能会在硬件中插入恶意电路，导致电路功能被恶意修改、信息泄露，甚至造成严重破坏并引发广泛恐慌。图1展示了将HT插入芯片供应链的过程。

为了减轻HT的威胁，过去几十年提出了多种检测技术。传统的硅前和硅后方法包括形式化验证（FV）[1]、代码分析（CA）[2]和侧信道分析（SCA）[3]。原则上，FV和CA可以保证功能正确性，但它们需要大量的人工工作和验证时间，难以扩展到复杂的片上系统（SoC）设计。SCA是非侵入性的，可以在制造后应用；然而，它依赖于可信的“黄金”参考模型，并且对测量环境非常敏感，这限制了其在当今全球化IC供应链中的鲁棒性和实用性。

鉴于这些限制，基于机器学习的方法直接在门级网表上操作，被提出作为HT检测的有希望的解决方案[4]、[5]、[6]、[7]。例如，一种基于分数的HT检测方法[5]引入了从网表中手动提取特征以辅助检测的新思路。Kurihara等人进一步提出了一种随机森林方法[6]，该方法显式地对触发电路进行建模，从网表中提取51个特征（结构和静态特征）以提高检测效率。与传统方法相比，这些方法在不需要黄金参考模型的情况下实现了良好的检测精度。然而，它们严重依赖手工制作的特征工程，使得为复杂电路提取准确特征变得具有挑战性。此外，由于它们在网表级别或过程节点上独立操作，难以捕捉丰富的拓扑依赖性，也无法提供细粒度的节点级定位。

为了减轻对手工特征提取的依赖，Yu等人结合了卷积神经网络（CNNs）和长短期记忆（LSTM）网络，从基于块的门级网表编码中学习特征[7]。这使得数据驱动的检测范式可以直接在门级网表上操作，并自动从原始结构信息中提取特征，从而提高了鲁棒性。然而，基于序列或块的编码只能部分捕捉电路的底层图结构，大多数此类模型仍然在网表级别进行分类。因此，它们无法直接识别恶意节点，仍然容易受到严重类别不平衡的影响。

图神经网络（GNNs）非常适合门级网表的数据结构，这促使人们将其与HT检测相结合。GNN4TJ将RTL代码细化为紧凑的数据流图，并训练GCN来决定设计是否包含HT[8]。这项工作强调了在电路图上传递消息的优势，但其预测仅限于图/RTL级别，无法定位确切的HT位置，可能会错过在综合或物理设计过程中插入的木马。Muralidhar等人进一步提出了一种基于对比学习的GCN触发检测器[9]，该检测器关注子图级别的触发模式，提高了对罕见恶意结构的敏感性，并显著提高了检测精度。然而，尽管对比学习增强了良性和木马节点之间的区分度，但也可能导致对训练分布的过拟合，从而削弱了对未见IP核心的泛化能力。在门级别，基于GraphSAINT[14]的TrojanSAINT[10]和相关的节点级采样方法[11]将基于GNN的节点分类扩展到大型工业基准测试中，据我们所知，这是首次报告跨多个电路家族的节点级检测。尽管如此，TrojanSAINT和节点级采样构建的是无向图，并依赖于阈值调整来处理类别不平衡，忽略了边的方向性和属性，可能会扭曲时序结构。此外，直接在极端不平衡的数据上进行训练而不进行结构增强，往往会错过罕见的HT节点或增加误报率。

同时，一些非GNN方法，如基于循环神经网络（RNNs）的检测器和分类器，也利用图中心性特征[12]、[13]进行门级HT检测。这些方法受益于成熟的序列模型或梯度提升决策树，有时可以实现强大的检测性能。然而，它们仍然依赖于手工制作的特征，并且没有解决在过采样时如何将合成少数样本重新注入电路的问题。

总体而言，如表1所示，现有技术在预测粒度、处理类别不平衡的策略以及数据增强过程中是否保持拓扑结构方面存在差异。受到这些差距的启发，并为了克服传统节点采样方案在图数据上的局限性，特别是在HT数据集严重类别不平衡的情况下，我们提出了SMOTrojan，这是一个新的HT节点生成和检测框架。这项工作扩展了我们之前的研究[15]。SMOTrojan在一个统一的架构中利用了GNNs和SMOTE的互补优势，引入了一种新的方法来处理类别不平衡。该框架能够在没有黄金参考设计的情况下实现节点级定位，同时平衡类别并合成HT节点的拓扑一致边。这项工作的主要贡献总结如下：

$•$
针对网表的基于结构的过采样。 一种基于结构感知的过采样算法，将SMOTE与门级网表结合，明确解决了合成节点的图附着问题。与产生孤立或连接较弱的节点的天真过采样方法不同，我们的方法在样本生成过程中保留了电路语义，生成了更准确和更具代表性的节点样本。
$•$
保持拓扑的边合成。 我们提出了一个自动边合成模块，该模块通过尊重（a）门类型兼容性、（b）局部输入/输出分布和（c）时序锥局部性，将合成的HT节点连接到DAG中。这种结构一致的增强避免了拓扑失真，提高了TPR和F1分数。
$•$
无需黄金模型的自动化HT检测流程。 SMOTrojan端到端执行特征提取、少数节点生成、边合成和GNN训练，无需任何黄金（可信）参考电路，从而提高了实用性和可扩展性。
$•$
在多种GNN家族上的广泛评估。 在17个Trust-HUB基准测试中，三种代表性的GNN——GCN、GAT和GraphSAGE——一致受益于所提出的增强方法，在TNR/TPR/F1方面取得了最先进的性能。这三种基于GNN的方法显示出比现有方法更优越的检测性能和鲁棒性。

本文的其余部分组织如下：第2节简要介绍了HT、SMOTE和相关GNN原理；第3节介绍了所提出的架构——从特征提取和节点生成到边合成，并提供了相应的算法；第4节描述了实验设置，包括模型架构和参数设置，以及三种评估的GNN变体模型；第5节报告了实验和分析结果，展示了三种模型的结果，验证了边合成，并与主流方法进行了比较；最后，第6节总结了本文。

节选

硬件木马

HT可以定义为某些恶意攻击者或竞争对手在芯片设计和制造过程中植入的恶意硬件模块。这些模块隐蔽地嵌入芯片中，旨在执行未经授权的操作或造成损害。在特定条件下，例如温度和频率的变化，HT可以被触发。当在这些情况下激活时，HT电路会对芯片执行一系列破坏性操作，包括

提出的HT检测系统

用于HT节点生成和检测的数据集来自Trust-HUB的HT库[20]、[21]，其中包含17个木马电路。图3展示了SMOTrojan流程。使用算法1从网表中提取特征。随后，算法2和算法3在图中生成HT节点和边，平衡数据集。预处理后，训练了三种GNN模型：GCN [22]、GAT [23]和GraphSAGE [24]

实验和参数设置

在本节中，我们将介绍实验的相关设置和训练参数，同时详细解释评估指标的含义。

实验结果和比较

本节验证了所提出的HT检测模型的性能，并评估了系统参数对实验结果的影响。

值得注意的是，鉴于节点级HT数据集的极端类别不平衡（见表2），我们的实验关注的是TNR、TPR和F1，而不是整体准确性。后者主要由绝大多数良性节点决定，因此很大程度上取决于这些节点中的误报数量。例如，一个模型

结论

本文解决了传统节点采样方法在图数据应用中的局限性，以及HT数据集中正常样本和HT样本之间的严重不平衡问题，提出了SMOTrojan，这是一个创新的HT节点生成和检测框架。基于SMOTE的节点生成算法针对HT特定特征进行了定制，通过自适应插值合成高保真的恶意样本，显著提高了检测精度。为了解决SMOTE的固有问题

CRediT作者贡献声明

刘飞：研究构思与设计、数据获取、数据分析和/或解释、手稿起草、对手稿重要内容的批判性修订、批准发表的手稿版本。苏子龙：研究构思与设计、数据获取、数据分析和/或解释、手稿起草、对手稿重要内容的批判性修订、批准发表的手稿版本

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争财务利益或个人关系。

致谢

本工作得到了国家自然科学基金（62474092、62371226、62425404、62022041、62134002）的资助。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号