移动应用程序已成为人们生活中不可或缺的一部分,应用范围涵盖了购物、银行、教育以及娱乐等多个领域。截至2025年4月,App Store和Google Play Store各自拥有200万款应用(Google, 2025; Apple, 2025)。随着移动应用及其用户数量的不断增长,用户的多样性也在不断增加。移动应用用户在年龄、种族、性别、教育水平和社会经济地位等方面存在显著差异(Ramos等人,2021;Khalajzadeh等人,2022)。这种快速的增长和应用使用的多样化凸显了应用在满足不同年龄段用户需求方面的明显差距。在这项研究中,我们特别关注移动应用评论中如何描述和讨论年龄问题,旨在揭示用户所表达的与年龄相关的关切。
随着儿童和老年人使用移动应用的增加,开发适合他们年龄的应用变得至关重要。不同年龄段的用户在使用软件时面临不同的问题,对同一软件的反应也可能不同(Grundy, 2021)。更熟悉技术的年轻人对应用的期望与老年人不同(Williams等人,2013)。儿童可能会接触到不适当的内容,并进行可能危及他们安全的互动。他们还存在认知和运动技能上的限制,这会影响他们与数字界面的互动方式(Yadav等人,2022;Clemente-Suárez等人,2024)。为儿童设计应用时需要考虑到他们有限的阅读能力、短暂的注意力以及探索性行为,这可能导致意外购买或不安全内容的浏览(Amaefule等人,2023;Booton等人,2023;Meyer等人,2019;Clemente-Suárez等人,2024)。
衰老会带来身体变化,尤其是感官功能的变化,影响与技术系统的互动能力。例如,随着年龄的增长,视力会下降,包括视觉敏锐度降低、色彩感知能力减弱、对比度敏感度降低以及对眩光的敏感度增加(Wirtz等人,2009)。成年用户可能会遇到复杂的界面或缺乏可访问性功能(Commissioner等人,2024;Government等人,2024;Chen等人,2013;Zhao等人,2023;Díaz-Bossini和Moreno,2014)。在为老年人设计软件界面时,应仔细考虑这些变化,通过选择合适的颜色、对比度、字体、界面元素的大小和设计来确保更好的可用性(Wirtz等人,2009)。忽视目标用户的年龄群体可能会导致软件过于复杂或不清楚,界面和工作流程不佳,缺乏吸引力或乐趣(Grundy,2021)。
确定人口统计因素(如年龄)如何影响应用的用户体验、用户偏好和挑战非常重要。许多应用没有考虑到这些与年龄相关的需求,因此有必要在用户体验和安全性等方面进行改进。移动应用中的年龄相关讨论可能包括家长控制不足、老年人阅读和导航困难等问题,所有这些都会导致数字环境不够包容。尽管这些因素很重要,但在研究和商业产品设计中仍常常被忽视(Sacar等人,2024)。
多项研究探讨了软件中的年龄相关问题,包括可用性问题、针对儿童的设计考虑以及老年人的可访问性(Jim等人,2021;Wirtz等人,2009;Eisenberg,1995;Sim等人,2006;Díaz-Bossini和Moreno,2014)。这些研究强调,适合年龄的设计不仅仅是视觉元素的问题,还强调了交互设计和清晰反馈的重要性。然而,目前还没有研究专门探讨过应用评论中如何讨论年龄问题。
Google Play Store和Apple App Store允许用户通过评论提供应用反馈。用户可以通过星级评分、评论或两者结合的方式提供反馈。这些评论数据可以提供用户对应用的看法(Khalid等人,2014)。此外,这些应用评论可以揭示开发者可能未预料到的关键问题,帮助开发者了解不同年龄段用户在互动应用时遇到的实际挑战。理解这些评论反馈将使移动应用开发者能够解决用户的问题,从而提高应用的评分(Khalid等人,2014)。
然而,与年龄相关的问题目前隐藏在数百万条应用评论中,并没有系统地呈现给开发者。大规模手动分析评论是不切实际的。因此,自动识别年龄相关讨论对于理解和响应不同生命阶段用户的多样化需求至关重要。通过自动检测这些讨论,我们的目标是帮助开发者、产品团队和平台管理员及早识别与年龄相关的可用性、安全性和内容问题,最终改善用户体验和包容性。
本研究探讨了移动应用评论中的年龄相关讨论。我们使用了Serebrenik和Baltes(2022)收集的数据集,其中包含来自Google Play Store的70款热门Android应用的700万条评论。然后我们手动构建并标注了一个包含4163条评论的数据集,其中1429条与年龄相关,2734条与年龄无关。我们使用了八种机器学习(ML)、深度学习(DL)和大语言模型(LLM)来区分与年龄相关的应用评论和与年龄无关的应用评论。RoBERTa分类器的表现最佳,准确率分别为92.70%、92.39%、92.45%和92.39%。在研究的第二阶段,我们手动分析了1429条与年龄相关的用户评论,发现这些评论主要围绕内容的适宜性、语言和推荐、年龄验证和访问障碍、跨年龄段的可用性和可访问性、隐私和安全问题、互动和关系以及推荐和功能请求等主题。
本研究的主要贡献包括:
•我们是第一个深入研究移动应用评论中年龄相关讨论的团队。
•我们开发了机器学习、深度学习和大语言模型,用于自动检测应用评论中的年龄相关讨论。
•我们对移动应用评论中的各种类型年龄相关讨论有了全面的理解。
•我们为开发考虑年龄相关因素的应用提供了建议。
本文的其余部分安排如下:第2节总结了相关工作,第3节介绍了我们的研究方法。第4节和第5节详细阐述了我们的两个研究问题及其结果。第6节我们对结果进行了反思。第7节报告了有效性的威胁因素。第8节总结了全文。