
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用数据增强和可解释人工智能对阿拉伯语应用评论进行多标签分类
【字体: 大 中 小 】 时间:2026年02月14日 来源:ARABIAN JOURNAL FOR SCIENCE AND ENGINEERING 2.9
编辑推荐:
多标签分类方法在阿拉伯应用评论分析中的应用研究,通过数据增强和模型微调有效提升了分类性能,LIME分析揭示了方言差异与标签重叠问题。
应用评论已成为开发者提升应用程序质量的重要反馈来源。尽管已有大量研究致力于自动化用户反馈分析,但对于多标签分类(尤其是阿拉伯语评论的分类)的关注仍然有限,而阿拉伯语是应用用户中广泛使用的语言。多标签阿拉伯语应用评论数据集的稀缺性进一步阻碍了这一领域的进展。本文研究了使用预训练的Transformer模型对阿拉伯语应用评论进行多标签分类的方法。我们使用了一个最近标注的数据集,该数据集包含四个类别:评分、改进建议、错误报告以及其他内容。此外,我们还利用ChatGPT-4生成合成评论以补充数据集中代表性不足的类别。我们对两个阿拉伯语Transformer模型CamelBert和MarBert进行了微调,并通过局部可解释模型不可知解释(LIME)技术应用可解释人工智能(XAI)来分析模型决策和关键词关联。结果表明,基于ChatGPT-4的数据增强提升了模型性能。经过数据增强的CamelBert模型获得了最高的宏观F1分数0.71,而经过数据增强的MarBert模型则实现了最低的汉明损失0.275,表明分类准确性得到了提升。LIME分析识别出与特定标签相关的关键术语,突出了代码转换带来的挑战,并揭示了数据集中的标注不一致性问题。我们的研究强调了微调后的Transformer模型在阿拉伯语应用评论多标签分类方面的有效性,尤其是在处理方言差异和重叠类别时。此外,将数据增强与LIME等可解释性工具相结合,为理解模型行为提供了宝贵的见解,尤其是在处理代码转换等语言复杂性问题时。
应用评论已成为开发者提升应用程序质量的重要反馈来源。尽管已有大量研究致力于自动化用户反馈分析,但对于多标签分类(尤其是阿拉伯语评论的分类)的关注仍然有限,而阿拉伯语是应用用户中广泛使用的语言。多标签阿拉伯语应用评论数据集的稀缺性进一步阻碍了这一领域的进展。本文研究了使用预训练的Transformer模型对阿拉伯语应用评论进行多标签分类的方法。我们使用了一个最近标注的数据集,该数据集包含四个类别:评分、改进建议、错误报告以及其他内容。此外,我们还利用ChatGPT-4生成合成评论以补充数据集中代表性不足的类别。我们对两个阿拉伯语Transformer模型CamelBert和MarBert进行了微调,并通过局部可解释模型不可知解释(LIME)技术应用可解释人工智能(XAI)来分析模型决策和关键词关联。结果表明,基于ChatGPT-4的数据增强提升了模型性能。经过数据增强的CamelBert模型获得了最高的宏观F1分数0.71,而经过数据增强的MarBert模型则实现了最低的汉明损失0.275,表明分类准确性得到了提升。LIME分析识别出与特定标签相关的关键术语,突出了代码转换带来的挑战,并揭示了数据集中的标注不一致性问题。我们的研究强调了微调后的Transformer模型在阿拉伯语应用评论多标签分类方面的有效性,尤其是在处理方言差异和重叠类别时。此外,将数据增强与LIME等可解释性工具相结合,为理解模型行为提供了宝贵的见解,尤其是在处理代码转换等语言复杂性问题时。