多视图多任务深度神经网络在茶叶分类与风味因素定量评估中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月12日 来源：Computers and Electronics in Agriculture 8.9

编辑推荐：

　　茶叶质量多维度评估模型Tea MvMtNet开发与验证。该模型通过干茶外观、茶汤颜色、废茶图像多视图融合，结合注意力增强的BiFPN网络、语义增强模块和动态多视图融合机制，实现茶叶分类及五个风味因子（外观、色泽、香气、滋味、废茶量）的量化评分。在809个中国产茶样测试中，分类准确率达98.11%，各项指标平均绝对误差低于32%，R2值达0.8359，较传统感官评价更具客观性和效率。

刘秦岭|周龙|王圆圆|王从明|孙彦云|王婷婷|陈柳毅|杜峰|赵月玲|杜晓

四川省茶叶资源利用与质量检测重点实验室，四川农业大学园艺学院，成都，四川，611130，中国

摘要

利用人工智能（AI）算法快速准确地评估茶叶质量对于有效进行质量管理至关重要。现有的算法主要关注一维数据（通常是干茶的外观）进行分类或分级，往往忽略了茶叶风味的复杂性。在这里，我们开发了Tea MvMtNet，这是一个多视图、多任务的深度神经网络，它处理来自干茶外观、冲泡颜色和废茶的视觉数据，以评估包括味道和香气在内的所有五个风味因素，并将茶叶分类为不同的类别。该模型结合了增强注意力的双向特征金字塔网络进行多尺度融合，从每个视图提取全局和局部细节。语义增强模块结合了先验知识，利用跨模态注意力和图注意力网络来细化视觉特征，以准确预测风味因素。此外，多视图融合动态地聚合三个视觉特征来预测香气、味道和茶叶类别。为了优化任务性能并解决数据不平衡问题，我们开发了一个多任务平衡的焦点回归损失函数用于多任务学习。我们的方法达到了98.11%的分类准确率，并在评估干茶外观（平均绝对误差百分比：19.60%）、冲泡颜色（28.40%）、香气（26.48%）、味道（31.67%）、废茶（17.20%）和总体得分（17.23%）方面表现出色，证明了该模型的准确性与高级茶叶评估员的水平相当。此外，总体得分的

R^{2}

值为0.8359，其中香气和味道的

R^{2}

>

值为0.75）。这些结果突显了Tea MvMtNet作为自动化茶叶质量管理的全面而精确的工具。

引言

茶叶是一种广泛消费的非酒精饮料，以其独特的风味和潜在的健康益处而闻名（Roh等人，2017年；Xia等人，2020年）。评估茶叶质量对于指导生产和提高质量至关重要（Yin等人，2022年；Zhai等人，2022年）。目前，这种评估主要依赖于专家小组进行的感官分析。这些专家对五个风味因素进行评分，包括干茶外观、冲泡颜色、味道、香气和废茶，这是研究和行业中最为权威的评估方法。然而，这种方法通常需要高度训练的专业人员，尽管它是行业标准，但本质上受到人类感知的影响。

人工智能（AI）算法最近在管理食品和农产品的质量方面取得了显著进展，通过减少劳动力和时间需求同时保持高精度（Guo等人，2023年；Wang和Yang，2023年；Zhang等人，2024年）。中红外和紫外光谱与机器学习模型的结合在确定大蒜来源方面实现了100%的精度（Han等人，2024年）。此外，FoodProX利用机器学习来预测食品加工的程度，提供了一种可扩展且可重复的方法，将饮食质量与疾病风险联系起来（Menichetti等人，2023年）。

在茶叶质量管理中，AI已与光谱和生化技术（如气相色谱-质谱、电子鼻（E-nose）和近红外光谱（NIRS）结合，用于质量分类（Yang等人，2021年；D. Li等人，2024年；Y.C. Li等人，2024年；Li等人，2025年）。例如，NIRS、E-eye、E-tongue和E-nose与深度卷积神经网络结合，用于评估颜色、香气、味道和形状，误分类率仅为0.86%（Ren等人，2024年）。其他研究确定了绿茶和黑茶中的关键化学指标，F1分数超过0.92（Lu等人，2024年），并将比色计和UV–vis传感器与粒子群优化支持向量机结合，实现了99.48%的来源可追溯性和量化CTC红茶中的主要风味化合物（Shen等人，2024年）。此外，基于图像的算法也被探索用于茶叶质量管理（Bakhshipour等人，2018年；Zhang等人，2023年）。最近的多模态研究进一步表明，整合异构表示可以提高复杂视觉任务中的细粒度识别性能（Kerdvibulvech，2025年）。大多数现有算法依赖于关于干茶外观的一维信息来分类或分级整体质量（Xia等人，2024年）。然而，评估茶叶质量需要考虑多个因素，包括冲泡颜色、香气、味道和废茶。即使是同一等级的茶叶，在五个风味因素上也存在很大差异，这突显了需要一种更全面的评估策略，考虑风味信息的全部范围。

在本文中，我们提出了Tea MvMtNet，这是一个多视图多任务的深度学习模型，它在统一框架内整合了来自三个不同视图的特征：外观、冲泡和废茶，以全面评估茶叶质量。Tea MvMtNet模型包括三个核心组件：多尺度特征融合模块、语义增强模块和多视图融合（MVF）模块。为了充分利用多样化的视觉信息，多尺度特征融合模块采用了双向特征金字塔网络（BiFPN）（Tan等人，2020年）和改进的卷积块注意力模块（CBAM）（Woo等人，2018年）。这些组件增强了模型捕捉全局和局部细节的能力，确保保留了微妙但重要的特征。语义增强模块通过结合先验评估元素，利用跨模态注意力和图注意力网络（GAT）（Velickovic等人，2017年）进一步丰富了模型。MVF模块使用像素级权重动态地整合来自不同视图的特征，增强了模型对茶叶质量多维方面的表示。此外，我们开发了一个多任务平衡的焦点回归损失函数，以解决数据不平衡问题并同时进行多任务优化。这些组件确保模型能够准确预测茶叶分类和感官评分。

我们的主要贡献总结如下：（1）提出了一个针对茶叶五个风味因素的定量评分框架，实现了茶叶质量的客观和细粒度评估。（2）设计了一个增强注意力的多尺度融合模块，保留了全局结构和局部细节，以细化语义特征。（3）提出了一个语义增强模块，通过跨模态注意力和图注意力机制结合了先验评估元素。（4）开发了一个新颖的MVF模块，动态地聚合多视图特征，增强了模型处理来自不同视图复杂视觉数据的能力。（5）开发了一个多任务平衡的焦点回归损失函数，提高了模型处理不平衡数据和同时优化多个任务的能力。

数据收集

茶叶样本来自四川省茶叶资源利用与质量检测重点实验室，时间跨度为2021年4月至2022年7月。共收集了来自中国18个产茶省份的809个茶叶样本，以确保类别和地理区域的多样性。数据集包括348种黑茶、246种黄茶和215种绿茶。其中703个茶叶样本用于模型训练，剩余的106个样本（48种黑茶、31种黄茶）

茶叶样本质量统计

本研究的数据集来自18个产茶省份，如图4(a)所示。四川省提供的样本数量最多（436个），其次是浙江省（93个样本）。茶叶样本被分为三类：黑茶（348个样本）、黄茶（246个样本）和绿茶（215个样本）（图4(b)）。这个多样化的数据集涵盖了广泛的地理区域和茶叶品种，对于茶叶的稳健训练至关重要

总体结论

Tea MvMtNet利用低成本、易于获取的图像，消除了对昂贵辅助仪器的依赖，从而提高了其实际应用性。通过整合多视图信息，它捕捉到了单视图模型经常忽略的微妙风味特征，实现了对所有五个风味因素的同时评估。这种全面可靠的方法代表了将深度学习应用于茶叶质量评估的进步。

主要创新包括

CRediT作者贡献声明

刘秦岭：撰写——原始草稿、可视化、方法论、调查、正式分析、数据整理。周龙：撰写——原始草稿、可视化、资源、方法论、调查。王圆圆：调查。王从明：撰写——原始草稿、调查。孙彦云：数据整理。王婷婷：调查。陈柳毅：调查。杜峰：调查。赵月玲：编辑。杜晓：撰写——审阅与编辑、可视化、监督、资源

伦理批准

在本研究的感官评估部分，经过培训的专家小组对茶叶样本进行了感官评估。除上述部分外，本研究不涉及其他与人类或动物的工作。本研究获得了中国当地伦理委员会的批准：“四川省中医药区域伦理审查委员会”，所有方法均按照相关指南和规定进行。在所有受试者参与之前，已获得他们的知情同意

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

作者衷心感谢易金辉博士、李坤洪博士、徐伟博士、刘家玲博士和吴悦博士在准备本手稿期间提供的宝贵支持和鼓励。同时特别感谢何涛先生和严丽淑女士在获取测试材料方面的协助。本研究得到了中国四川省科技项目的资助，项目名称为“研究与示范

联系信箱：

粤ICP备09063491号

摘要

引言