编辑推荐:
将表格数值数据转换为灰度图像 representations,使CNN等深度学习模型能有效处理传统数值数据集,并在四个数据集上验证其高效性。
阿卜杜拉·埃伦(Abdullah Elen)| 埃姆雷·阿武克卢(Emre Avu?lu)
土耳其巴勒克埃西尔省班迪尔马市班迪尔马奥内迪埃伊卢尔大学(Bandirma Onyedi Eylul University)工程与自然科学学院软件工程系
摘要
深度学习(Deep Learning, DL)在处理图像、文本和音频等非结构化数据方面取得了显著成功,但由于缺乏内在的空间结构,其在表格型数值数据集上的应用仍然具有挑战性。在这项研究中,我们提出了一种将数值表格数据转换为灰度图像表示的新方法,从而使得卷积神经网络(Convolutional Neural Networks)和其他深度学习架构能够有效地应用于传统的数值数据集。该方法对特征进行了标准化处理,将它们组织成方形图像矩阵,并生成用于分类的标记图像。实验在四个公开可用的数据集上进行:Rice MSC 数据集(RMSCD)、手写数字的光学识别(Optdigits)、TUNADROMD 和 Spambase。转换后的数据集使用残差网络(ResNet-18)和有向无环图神经网络(DAG-Net)模型进行了评估,并采用了 5 折交叉验证。DAG-Net 模型在 RMSCD 上的准确率为 99.91%,在 Optdigits 上为 99.77%,在 TUNADROMD 上为 98.84%,在 Spambase 上为 93.06%,证明了所提出转换方法的有效性。额外的消融研究和效率分析显示了训练性能和计算成本的提升。结果表明,这种基于图像的转换方法为将数值数据集集成到深度学习工作流程中提供了一种实用且高效的方式,扩展了深度学习技术在各个领域的应用范围。该实现以开源软件的形式发布,以便于复制和进一步研究。
引言
数值表格数据集通常由行和列组成,其中每一行代表一个样本,每一列代表一个特征。这类数据集已被广泛用于科学研究中的分类、回归、聚类等任务,采用了机器学习(Machine Learning, ML)和数据挖掘方法(Upadhyay 等人,2022 年;Mostafa 等人,2024 年)。表格数据集为医疗保健、金融、市场营销和生物学等多个领域提供了基础数据。Kaggle、KEEL 和 UCI ML Repository 等数据存储库拥有大量可供研究人员和开发者使用的数据集(Moreno-Ibarra 等人,2021 年;Saxena 等人,2019 年)。这类数据集的结构通常直观且易于处理,因为大多数机器学习库(例如 scikit-learn、pandas、TensorFlow)都针对它们进行了优化。
深度学习(Deep Learning, DL)在处理文本、图像和音频等非结构化数据方面取得了快速进展。然而,在表格数据分析中,机器学习算法在许多情况下仍然优于深度学习方法。尽管最近提出了多种深度学习方法来处理表格数据并取得了与机器学习算法相当的结果(Hwang 和 Song,2023 年),但传统方法——尤其是树集成模型——仍然常被推荐用于这种类型数据的分类和回归任务。
一个关键挑战在于将强大的深度学习模型(特别是卷积神经网络(Convolutional Neural Networks, CNN)应用于表格数据。CNN 通常用于揭示特征之间的隐藏空间关系(Shwartz-Ziv 和 Armon,2022 年),但大多数表格数据集并不具备这种空间关系,因此直接使用 CNN 进行建模并不合适。最近,将表格数据转换为图像以训练深度 CNN 成为一种有效的方法,可以将结构化数据问题转化为空间问题(Novikova 等人,2024 年;Briner 等人,2023 年)。这表明,开发新的方法和转换方式,使深度学习算法能更有效地处理这些数据类型,是数据科学和机器学习发展的重要步骤(Zhu 等人,2021 年)。
使用传统机器学习算法的研究通常涉及数值数据而非图像数据,这限制了深度学习模型的直接应用。在这项研究中,提出了一种创新方法,将数值数据集转换为图像格式,以便它们能有效地用于深度学习模型。这种方法不仅使深度学习算法能够应用于图像数据集,也能应用于传统的数值数据。
本研究的贡献如下:
■它引入了一种将数值数据集转换为图像表示的新方法,从而使传统上用于图像数据的深度学习模型也能应用于数值数据。
■它通过减少深度学习模型的训练时间来提高效率。
■它使得文献中已知的、存在于 Kaggle、UCI 和 KEEL 等存储库中的传统数值数据集能够与深度学习算法结合使用。
本文的其他内容安排如下:第二节讨论了相关工作。第三节详细解释了所提出方法的工作原理,并附有数学符号和伪代码。第四节提供了 DAG-Net 和 ResNet-18 深度学习模型的结构和原理,以及所使用数据集的全面信息,还包括实验设计阶段的总结。第五节详细讨论了实验结果。第六节将所提出的方法与文献中的研究进行了比较,并讨论了该方法的局限性和差异。第七节也是最后一部分,展示了重要的研究结果、该方法的应用性以及对未来研究方向的见解。
相关研究
相关研究
研究人员解决实际数据科学相关问题的一个关键要素是确定要使用的模型类型。对于使用表格数据的分类和回归问题,通常推荐使用树集成模型。然而,最近提出了几种深度学习模型,这些模型在某些用例中声称优于树集成模型。通过在新深度学习模型与树集成模型之间对各种数据集进行比较,发现这些深度模型
材料与方法
在这项研究中,我们旨在通过将数值数据转换为图像来弥合数值数据集与深度学习模型之间的差距。这种转换使得先进的图像识别模型(如有向无环图网络和残差网络)能够应用于数字数据,从而实现更快速、更准确的分类。我们研究中使用的数据集包括 Rice 图像数据集和 Rice MSC 数据集(从 Rice 图像数据集派生出的特征数据集)
提出的方法
在这项研究中,我们提出了一个方法,以便在数值表格数据集上使用深度学习模型。传统的深度学习方法,尤其是卷积神经网络(CNN),本质上不适用于直接处理表格数据,因为无法充分利用特征之间的空间关系和模式。这一限制常常导致模型性能不佳。
所提出的方法通过将数值数据转换为图像格式来解决这一挑战,从而使深度学习模型能够充分利用这些数据
实验结果
在实验研究中,使用四个主要数据集评估了所提出的方法。在第一组实验中,使用了 RID 及其派生的特征数据集 RMSCD。RID 包含 75,000 张五种水稻品种的图像,每种品种有 15,000 张图像,分辨率为 250 × 250 像素。RMSCD 是从 RID 派生出的数值表格数据集,每个样本包含 106 个特征,包括 12 个形态特征、4 个形状特征和 90 个基于颜色的特征
讨论
在这项研究中,研究了将数值数据集转换为图像格式的过程,以及由此产生的图像在深度学习模型中的分类效果。由于深度学习模型不能直接处理数值数据,因此强调了将这些数据转换为适当格式的必要性。在本节中,将所开发的方法与文献中的现有研究进行了比较。分别为 RID/RMSCD 和
局限性与未来工作
本研究提出了一种将数值表格数据转换为深度学习(Deep Learning, DL)模型图像表示的新方法。虽然结果证明了所提出方法的有效性,但必须承认某些局限性,这些局限性也为未来的研究指明了方向。
首先,核心局限性在于人为假设了空间关系。我们的转换过程人为地为非空间表格特征施加了空间结构,以便利用这些关系
结论
本研究提出了一种将表格数值数据转换为图像表示的新方法,使得深度学习模型——特别是卷积神经网络——能够有效地应用于传统上由经典机器学习方法处理的数据集。通过标准化特征并将它们排列成方形图像矩阵,所提出的方法使数值数据集能够受益于深度架构的空间学习能力
未引用的参考文献
(Panagopoulos 等人,2016)
CRediT 作者贡献声明
阿卜杜拉·埃伦(Abdullah Elen):撰写 – 审稿与编辑、撰写 – 原稿、可视化、验证、软件、资源、方法论、调查、形式分析、数据整理、概念化。埃姆雷·阿武克卢(Emre Avu?lu):撰写 – 审稿与编辑、撰写 – 原稿、可视化、验证、软件、资源、方法论、调查、形式分析、数据整理、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。