预测高等院校(Higher Educational Institutions, HEIs)社交媒体互动(Engagement):一种机器学习(Machine Learning, ML)方法

《Journal of Digital Economy》:Predicting Social Media Engagement in Higher Educational Institutions: A Machine Learning Approach

【字体: 时间:2026年06月06日 来源:Journal of Digital Economy CS2.3

编辑推荐:

  摘要:社交媒体互动(Engagement)在高等院校(Higher Educational Institutes, HEIs)的营销活动中起着至关重要的作用。现有研究清楚表明,仅拥有社交媒体存在感及发布内容而无相应策略并不会带来HEIs更高的知名度、品牌塑造或

  
摘要:社交媒体互动(Engagement)在高等院校(Higher Educational Institutes, HEIs)的营销活动中起着至关重要的作用。现有研究清楚表明,仅拥有社交媒体存在感及发布内容而无相应策略并不会带来HEIs更高的知名度、品牌塑造或招生效果。据此,本研究尝试在新兴市场背景下为HEIs构建社交媒体互动的预测模型。研究采用某HEIs官方Facebook页面(Page Insights)的历史数据用于建模。首先进行数据预处理与特征工程(Feature Engineering),随后基于聚类(K-means)进行类别标注(Class-labelling)。标注后的类别进一步使用若干机器学习(Machine Learning, ML)分类器进行训练,并基于K折交叉验证(K-fold Cross-validation)遴选性能最优的模型。对优选分类器进一步执行超参数优化(Hyperparameter Optimization)。本研究是在新兴市场背景下为HEIs社交媒体互动构建预测模型的开拓性尝试。所提出的预测模型可作为制定社交媒体内容发布策略的实用工具。
研究背景与意义
高等院校(Higher Educational Institutions, HEIs)在过去十年中经历了重大数字化转型,特别是受COVID-19疫情影响,教学、沟通与评估大量迁移至在线平台。社交媒体已成为HEIs与利益相关者沟通、展示独特价值主张、提升可见度及建立校友关系的重要工具。然而,现有关于HEIs社交媒体互动(Engagement)的研究多采用描述性或相关性分析,关注内容主题、机构声誉关联等,缺乏能够指导单条帖子内容策略的可操作预测性见解,导致多数HEIs仍凭直觉而非数据驱动方式管理社交媒体。此外,新兴市场(如印度)背景下HEIs竞争激烈,受众行为具独特性,更需本土化的预测框架。为此,研究人员以印度一所多学科HEIs的Facebook官方页面数据为对象,构建二分类预测模型以判断单条帖子是否将获得高互动,填补HEIs社交媒体互动预测建模的空白,为社交媒体管理者提供基于证据的内容排期与格式决策依据。本研究发表于《Journal of Digital Economy》。
主要关键技术方法
研究人员采集印度某多学科HEIs官方Facebook页面2019年12月25日至2022年12月25日共921条帖子历史数据,以"Lifetime People who have liked your Page and engaged with your post"为原始互动指标。对内容类型(照片/链接/状态/视频/分享视频)、发布月份(按季度分箱)、发布时刻(24小时按6时段分箱)、星期几(含周末标识)进行独热编码(One-hot Encoding / Dummy Variables),新增"Days Since Post"控制反应时间窗口,共得23个衍生特征。因互动指标高度偏态,采用K-means聚类(经肘部Elbow法与轮廓Silhouette法确定K=2)将帖子标记为"高互动(High Engagement)"与"低互动(Low Engagement)",并对少数类随机过采样(Random Oversampling)平衡数据集。使用卡方检验(Chi-squared Test, α=0.05)筛选显著特征,随后分别训练朴素贝叶斯(Na?ve Bayes)、逻辑回归(Logistic Regression)、线性核/多项式核/S形核/RBF核支持向量机(Support Vector Machine, SVM)、多层感知器(Multi-Layer Perceptron, MLP)及极端梯度提升树(eXtreme Gradient Boosting, XGBoost)。以10折交叉验证评估准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-score),对最优模型使用随机搜索(Random Search)进行超参数优化(Hyperparameter Tuning),并通过重复交叉验证及配对t检验、McNemar检验验证模型稳健性与显著性差异。
研究结果
4.1. Derived features describing content's characteristics
研究人员经特征工程从原始属性(内容类型、发布时刻、发布星期)生成23个哑变量特征,包括5种内容类型、4个季度月份区间、6个时段区间、7个星期及周末标志,作为模型输入。
4.2. Clustering results and class labelling
通过肘部法(Elbow Method)与轮廓系数法(Silhouette Method)确定最佳聚类数为2,K-means产生两簇分别含463和458条(过采样后均衡)数据点,分别标注为"高互动"与"低互动",并对初始不平衡数据做随机过采样使两类比例相等。
4.3. Selected attributes from feature selection
经卡方独立性检验(p<0.05),从23个特征中筛选出15个与互动类别显著相关的特征,包括内容类型中的照片与分享视频、时段中的4–7时及20–23时、月份中4–6月、周五及周末等,其中部分特征卡方统计量较高者为月份4–6月(χ2=8.896)及分享视频/16–19时(χ2=4.627)。
4.4. Classification model evaluation results
未经超参数优化的基准模型中,SVM(多项式核与RBF核)与XGBoost表现较优,准确率分别为79.2%(SVM Poly/RBF)与74.4%(XGBoost),而Sigmoid核SVM(66.2%)与朴素贝叶斯(72.0%)相对较差。
4.5. Hyper parameter optimized results of the best-chosen models
对表现最佳的SVM RBF与XGBoost进行随机搜索超参数优化后,优化SVM RBF达准确率84.0%(Precision=0.828, Recall=0.684, F1高=0.744; Precision=0.744, Recall=0.876, F1低=0.804),优化XGBoost达准确率81.6%(Precision=0.816, Recall=0.672, F1高=0.732; Precision=0.828, Recall=0.948, F1低=0.876)。
4.6. Feature importance analysis
基于优化XGBoost的特征重要性(Feature Importance)分析显示,最具预测力的三个特征依次为:发布时段4–7时(Time_of_the_day_4_to_7)、周五(Day_of_the_week_Fri)、深夜0–3时(Time_of_the_day_0_to_3),说明早晨早段与周五是该校受众活跃高峰,深夜亦为学生群体浏览高峰。
4.7. Robustness and Stability Analysis
重复10折交叉验证(5次重复)显示优化SVM RBF均值准确率83.6%(SD=0.017),优化XGBoost均值81.2%(SD=0.020),标准差较小表明模型稳定。配对t检验比较两最优模型得p=0.009(<0.05),拒绝无差异原假设,SVM RBF显著优于XGBoost。McNemar检验得χ2=5.07, p=0.013(<0.05),同样表明SVM RBF分类错误分布显著优于XGBoost,确认优化SVM(RBF核)为该情境下最稳健的预测模型。
讨论与结论(总结翻译)
研究人员指出,先前HEIs社交媒体研究多为描述性,缺乏帖子层面的可操作预测洞察。本研究通过构建二元分类预测框架,证明HEIs Facebook帖子互动可由帖子级元数据(内容类型、发布时间、星期)有效预测——优化SVM(RBF核)准确率达84%,XGBoost达81.6%。最重要的预测因子为清晨4–7时发布、周五发布及深夜发布窗口。该预测模型可供HEIs社媒管理者在发布前评估帖子获得高互动的概率,据此调整内容格式与排期,从事后评估转向前瞻性、数据驱动的社媒内容规划。研究局限在于未纳入文本语义主题与情感极性,未来可结合自然语言处理(Natural Language Processing, NLP)及Transformer嵌入、扩展至多平台(Instagram/X/LinkedIn)并建立分平台模型。本研究表明预测分析可桥接描述性研究与可操作数字营销策略,为新兴市场教育机构强化数字互动提供方法论与实证依据。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号