《Computers in Biology and Medicine》:Task-specific neural networks for medical imaging using pretrained fragments
编辑推荐:
StitchNet框架通过整合预训练神经网络片段提升医学图像分类效率,在AMD视网膜图像三分类任务中实现6%性能提升,并验证RNN与自编码器的增强效果。
沙菲格·阿什拉菲(Shafigh Ashrafi)| 赫迪耶·萨杰迪(Hedieh Sajedi)
伊朗德黑兰大学理学院数学、统计与计算机科学系
摘要
StitchNet框架通过提出从预训练片段构建神经网络的方法,为神经架构搜索(NAS)带来了范式的转变。这种方法降低了计算成本,并能够在不重新训练整个网络的情况下创建特定任务的模型。基于这一基础,我们的研究评估了StitchNet在构建用于医学图像分类任务的神经网络中的实际应用。具体来说,我们测试了其在将视网膜图像分为三类(健康、干性及湿性年龄相关性黄斑变性,即玻璃膜疣和脉络膜新生血管形成)的数据集上的性能。通过使用五个预训练网络的片段,并结合循环神经网络(RNN)和自编码器等技术,我们旨在验证和提升StitchNet的能力。研究结果表明,尽管StitchNet在计算开销上有所降低,但加入领域特定优化后,其适应性和效率得到了进一步提升。因此,所开发的网络比科学家手动设计的网络性能提高了6%。在下一阶段,我们将探索提高算法效率的方法并减少处理所需的数据量。完整可复现的代码链接如下:
https://github.com/ShafighAshrafi/stitchnet。
引言
神经架构搜索(NAS)是自动机器学习(AutoML)[1,2]的一个子领域,专注于自动化神经网络架构的设计,解决了机器学习工作流程中的关键挑战,如数据预处理、特征选择、超参数优化[3]和模型架构设计。传统上,NAS方法依赖于强化学习[4]和进化算法来发现高性能的神经网络拓扑结构,这些拓扑结构通常表示为有向无环图。尽管这些方法取得了显著进展,但它们计算量大且需要大量标记数据,因此在资源受限的环境(如边缘计算)或计算能力有限的领域中并不实用。尽管神经网络的手动设计和优化在图像分类和自然语言处理等领域产生了变革性影响,但仍然耗时且需要专家知识。这为在医学成像等资源稀缺的领域部署机器学习技术带来了重大障碍。解决这些限制对于充分发挥NAS的潜力并推动机器学习技术的更广泛应用至关重要。
为了解决这些挑战,StitchNet[5]框架提出了一种创新方法,即通过使用预训练片段来构建神经网络,并以中心核对齐(CKA)[6,7]等兼容性度量作为指导。这种方法大大减少了对外部数据和重新训练的依赖,为在资源受限环境中创建高效的、特定任务的神经网络铺平了道路。StitchNet通过重用和组装现有网络片段展示了实现竞争性能的潜力,为传统NAS技术提供了一种资源高效的替代方案。然而,其在医学成像等实际场景中的应用仍需进一步探索。
可拼接神经网络通过在可拼接层对之间插入一个线性层,在搜索空间中创建候选模型。一对可拼接层中的每个层都来自一个输入模型。虽然可拼接神经网络之前已在更广泛和通用的数据集上进行了测试,但参考文献[8]中的研究表明,这种拼接方法在较小的医学数据集上也同样有效。
本研究旨在评估和扩展StitchNet方法,解决其局限性,并探究其在小型、特定领域数据集上的适应性。通过使用RNN和自编码器等技术,我们研究了该框架是否能够有效适应小型、特定领域的数据集。
本研究旨在回答以下问题:
1.StitchNet能否为医学成像任务构建高效且准确的神经网络?
2.哪些改进可以提高其在资源受限环境中的适应性和性能?
本文的其余部分组织如下:第2节回顾了相关工作,讨论了传统的NAS方法及其局限性,以及StitchNet框架在医学成像领域的潜力。第3节概述了研究方法,详细介绍了实验设计、数据预处理以及使用StitchNet框架构建和评估神经网络的技术。第4节展示了结果并讨论了发现,突出了构建出的架构的性能、它们的适应性以及RNN和自编码器等集成增强技术的角色。第5节总结了本文的主要贡献,并指出了未来研究的方向,包括将StitchNet的应用扩展到更大规模的数据集,以及探索优化其片段重组过程的混合方法。
相关研究
相关工作
神经网络构建方法的发展取得了显著进展,尤其是在提高计算效率和适应资源受限环境方面。本节将相关工作分为四个领域:神经架构搜索(NAS)、基于片段的方法、兼容性和拼接机制以及特定任务的网络构建。
方法论
本研究开发并评估了一个受StitchNet启发的框架,用于构建特定任务的神经网络。该方法论系统地建立在StitchNet的基础上,根据目标任务的需求进行了改进和调整。该过程包括几个关键组成部分:定义研究主题、建立实验条件以及详细说明实验和测量的程序。
结果与讨论
结果表明,StitchNet框架能够有效地为医学成像任务构建准确且高效的神经网络。主要发现包括:
1.准确性提升:与传统方法相比,构建的架构在分类准确性上提高了6%。
2.效率:集成LSTM和自编码器可以减少训练所需的网络数量,从而缩短生成特定任务高效网络的时间。
有趣的结果
结论
本研究验证了StitchNet框架在资源受限环境中构建特定任务神经网络的潜力。通过重用预训练片段并利用中心核对齐(CKA)等兼容性度量,StitchNet在医学成像任务中实现了高准确性和计算效率。自编码器和RNN的集成进一步增强了其对特定领域挑战的适应性。
研究结果强调了StitchNet作为一种实用替代方案的重要性
作者贡献声明
沙菲格·阿什拉菲(Shafigh Ashrafi):撰写——原始草案、可视化、验证、方法论设计。赫迪耶·萨杰迪(Hedieh Sajedi):撰写——审稿与编辑、验证、监督、概念化。
符合伦理标准
伦理声明:本文不包含任何涉及人类参与者或动物的研究。
资金来源
本研究基于伊朗国家科学基金会(INSF)资助的项目(项目编号4037260)。
利益冲突声明
伦理声明:本文不涉及人类受试者,因此无需签署知情同意书。
作者声明没有利益冲突。