
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一个用于时间序列超分辨率的合成数据集,结合了深度学习技术
《Scientific Data》:A synthetic dataset for time series super-resolution with deep learning
【字体: 大 中 小 】 时间:2026年05月04日 来源:Scientific Data 6.9
编辑推荐:
摘要 时间序列分析在生物医学工程或电信等领域的应用日益广泛,这凸显了训练和评估先进机器学习模型时对高质量数据的需求。然而,以合适的分辨率获取时间序列数据常常受到伦理、经济或实际限制的制约。我们提出了CoSiBD(复杂信号超分辨率基准数据集),这是一个专为可重复
时间序列分析在生物医学工程或电信等领域的应用日益广泛,这凸显了训练和评估先进机器学习模型时对高质量数据的需求。然而,以合适的分辨率获取时间序列数据常常受到伦理、经济或实际限制的制约。我们提出了CoSiBD(复杂信号超分辨率基准数据集),这是一个专为可重复的时间序列超分辨率研究设计的合成数据集。CoSiBD提供了2,500个高分辨率信号(每个信号在参考域τ ∈ [0, 4π]内包含5,000个样本),以及对应的低分辨率版本(分别包含150、250、500和1,000个样本),这些低分辨率版本是通过均匀抽取方法获得的。这些信号通过分段频率调制和基于样条的幅度包络生成,具有多种非平稳特性,并提供了干净和含噪声的信号类型。数据以NumPy数组、纯文本和JSON格式提供,同时附带详细的元数据,包括信号段结构、生成参数和种子信息,以确保完全的可重复性。技术验证分析了这些信号的光谱特性,并报告了在脑电图(EEG)和语音数据上的超分辨率基准测试和迁移实验结果。