通过整合热重分析、近红外光谱以及属性编码的指纹识别数据,数据驱动地发现用于新型替代烟草叶的混合规则
《Journal of Analytical and Applied Pyrolysis》:Data-driven discovery of tobacco leaf blending rules for new replacement through integration of thermogravimetric, near-infrared, and attribute-encoded fingerprinting data
【字体:
大
中
小
】
时间:2026年01月19日
来源:Journal of Analytical and Applied Pyrolysis 6.2
编辑推荐:
烟草原料替换与配方维护需科学量化方法,本研究提出多模态数据融合策略,整合TGA热解特性、NIR光谱特征及属性编码指纹(AEF),通过5775条历史数据提取390核心样本,构建正交投影融合模型与属性变化评分体系,实现85%最高推荐准确率,有效支撑配方优化与历史复现。
季阳|钱高|钱旭阳|惠江|魏张|施云堂|刘泽|陈艾明|曾中达
中国烟草云南工业有限公司研发中心,云南烟草化学重点实验室,中国昆明洪津路367号,650231
摘要
烟草原材料的替代以及混合配方的维护是持续优化香烟产品和发展新产品的关键过程。针对传统替代策略过于依赖经验且缺乏量化规则的局限性,本文提出了一种多模态、数据驱动的方法,整合了热重分析(TGA)数据、近红外(NIR)光谱信息和编码的指纹特征。该方法系统地揭示了烟草叶片替代中的结构模式,并构建了一个智能推荐模型。首先,建立了一个包含5775条历史替代记录的大规模替代数据库,从中提取了390个同时具有TGA和NIR数据的典型替代样本。在此基础上,设计了多层次的属性变化场景,并分别对TGA、NIR及其融合数据进行了特征选择和相似性计算。该方法包括强相关或弱相关点的提取、关键特征的强制包含,以及使用正交投影的TGA和NIR数据融合策略,显著增强了维度间的信息互补性和特征表示能力。同时,构建了一个属性编码矩阵,系统地编码了烟草叶片的年份、产地、品种、部位和等级。结合历史变化频率,开发了一个属性变化评分模型,以辅助评估替代方案的合理性。使用33组实际验证样本来评估模型性能。结果表明,所提出的方法在前三名推荐准确性方面显著优于单一数据源策略,最高准确率达到85%,即使在涉及大量属性变化的场景中也能保持稳健的性能。该工作为烟草混合替代提供了一种科学、可量化且可验证的智能推荐方法,为新产品的快速开发以及历史配方的有效维护提供了理论基础和技术支持。
部分摘录
背景
烟草原材料的替代和混合配方的维护对确保香烟产品质量的稳定性和一致性至关重要,同时直接影响新产品的开发效率和管理成本[1]、[2]、[3]。随着原材料供应的动态变化、监管政策的持续调整以及消费者需求的日益多样化,建立一种科学和量化的烟草叶片替代机制变得尤为重要
多源数据融合的理论基础
在烟草混合替代研究中,通常依赖单一数据源,往往无法全面捕捉烟草叶片的复杂特性。TGA和NIR是两种重要的分析技术,分别从热学和光谱角度表征烟草叶片的性质,并表现出显著的信息互补性。TGA测量烟草叶片在程序化温度下的质量变化,揭示其热
实验分析
在烟草叶片研究领域,TGA和NIR的应用为叶片性质的深入表征提供了强有力的支持。然而,传统研究往往未能充分利用这两种技术生成的数据的互补性。为了克服这一限制,本研究以全面系统的方式进行了探讨,旨在阐明TGA和NIR数据之间的互补机制,并开发出更精确的模型
基于TGA数据的配方替代模式挖掘
TGA数据的挖掘基于2024年3月至2025年5月收集的1567个样本。经过重复性测试后,移除了55个异常值,剩余数据与历史替代记录进行匹配,得到390条核心记录。主成分分析(PCA)显示,前五个主成分占TGA数据累积方差的92%(见图3(A))。其中,PC1包含了55.99%的方差,反映了质量损失的整体趋势
讨论
本研究整合了TGA、NIR和AEF数据,构建了一个多维分析框架用于烟草叶片配方的替代。其核心创新在于克服了传统单因素分析的局限性,实现了“微观热分解特征 - 宏观化学组成 - 属性结构变化”的协同表示。TGA和NIR数据的正交投影融合策略显著提高了推荐
结论
本研究解决了传统烟草叶片配方替代中的行业挑战,即决策严重依赖难以量化的经验和模式。这是一种多模态、数据驱动的方法,整合了TGA、NIR和AEF。系统地开发了一个烟草叶片替代的智能推荐模型。通过整合5775条历史替代记录并提取390个同时具有TGA和NIR数据的样本,实现了多层次的属性
CRediT作者贡献声明
陈艾明:撰写 – 审稿与编辑、验证、方法论。刘泽:撰写 – 审稿与编辑、形式分析。钱旭阳:撰写 – 审稿与编辑、验证、调查、数据管理。钱高:撰写 – 审稿与编辑、验证、方法论、数据管理。季阳:撰写 – 原稿撰写、验证、软件开发、方法论、调查、数据管理、概念化。曾中达:撰写 – 审稿与编辑、监督、方法论、概念化。施云堂:
资助
本研究得到了中国烟草总公司的“香烟燃烧过程中所有组分热特性的多维数据构建与应用”(项目编号:110202201054)和“以产品设计为导向的烟草叶片原材料质量的多维数字化表征与应用”(项目编号:110202401030)这两个重大专项项目的支持,以及“典型
利益冲突声明
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:季阳报告称得到了中国烟草云南工业有限公司的财务支持;如果还有其他作者,他们声明没有已知的可能会影响本报告工作的财务利益或个人关系
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号