跳转至

Among Us: Language of Conspiracy Theorists on Mainstream Reddit

会议: ACL 2026
arXiv: 2506.05086
代码: 无
领域: Social Computing / Computational Linguistics
关键词: 阴谋论, 语言特征, Reddit分析, 心理语言学, 社区适应性

一句话总结

分析5亿条Reddit评论的10年纵向数据,发现活跃于阴谋论社区的用户在主流社区中也展现出可检测的独特语言模式(平均87%分类准确率),但这些模式高度依赖社区上下文,社区特定模型比全局模型高出最多17个百分点。

研究背景与动机

领域现状:阴谋论不仅是边缘信仰——它们与疫苗犹豫、公共健康风险甚至对民主制度的威胁(如2021年国会山事件)相关。现有研究主要关注阴谋论内容的检测,但忽略了阴谋论信仰者在主流空间中的语言表现。

现有痛点:(1) 已知阴谋论者使用特定修辞风格和词汇,但不清楚这些模式是仅限于阴谋论空间还是渗透到主流交流中;(2) 现有检测方法多关注内容层面(如主题词),忽略了与讨论话题无关的语言风格特征。

核心矛盾:阴谋论者是否具有一种渗透到所有交流中的"阴谋论心态"(monological worldview),还是他们能够完全适应不同社区的语言规范?

本文目标:利用大规模纵向数据系统检验阴谋论社区用户在主流空间中的语言可区分性。

切入角度:使用LIWC-22心理语言学特征(而非话题词)构建用户语言画像,在22个主流社区上分别训练分类器。

核心 idea:阴谋论用户的语言确实可区分,但区分模式高度依赖社区——没有单一的全局模型能捕捉这些模式,需要社区特定的分析。

方法详解

整体框架

这篇工作要回答的问题是:常混迹于阴谋论社区的用户,到了主流社区是否还"露出马脚"——即便不谈阴谋论话题,他们的语言风格是否仍可被识别。整体流程是:先从十年的 Reddit 评论里抽出 r/conspiracy 活跃用户与普通用户两类人,用 LIWC-22 心理语言学词典把每个用户在某个主流社区的发言压成一组风格特征向量,然后在每个社区上单独训练一个分类器去区分两类人,最后用 SHAP 拆解每个社区究竟靠哪些特征区分,并比较不同社区的区分模式是否一致。

```mermaid %%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%% flowchart TD A["十年 Reddit 评论
2013–2023 约 5.1 亿条"] --> B["大规模纵向数据构建
抽 r/conspiracy 活跃用户 + 普通用户
剔机器人 / 评论数<20"] B --> C["LIWC-22 风格特征
每用户在某社区压成风格向量"] C --> D["社区特定分类实验
每社区单独训 Random Forest
重复 5 次采样 + 置换检验"] D -->|准确率显著高于随机| E["SHAP 特征重要性 + 跨社区聚类
110 维重要性向量做层级聚类"] E -->|特征因社区而异| F["结论:可区分但上下文依赖"]

关键设计

1. 大规模纵向数据构建:用十年评论压出稳定的语言画像,避免被短期噪声带偏

判断一个人的"语言风格"不能只看几条评论——少量数据很容易被一时的话题或情绪主导,得出的画像并不稳定。为此作者从 Pushshift Reddit 数据集里提取 2013–2023 年约 \(5.1\) 亿条评论,覆盖 r/conspiracy 的 98 万用户和 22 个主流社区,并剔除机器人账号以及评论数 \(<20\) 的低活跃用户。只有积累了足够的发言量,每个用户在某社区里的 LIWC 特征向量才会收敛到一个能代表其稳定风格的画像。

2. 社区特定分类实验:用分类器当"探针"量化可区分性,而不是当目的

要验证的不是"能不能造一个好分类器",而是"阴谋论用户在主流空间里到底有没有可识别的语言痕迹",分类器只是把这种可区分性量化出来的代理工具。具体做法是对每个主流社区单独训练一个 Random Forest:正类是曾在 r/conspiracy 评论过的用户,负类是从同社区随机采样的等量普通用户,并重复 5 次随机采样以压低方差。关键不在最终准确率本身,而在于通过置换检验确认这个准确率显著高于随机——只要显著,就说明该社区里两类人的语言风格确有可分的差异。

3. SHAP 特征重要性分析与跨社区聚类:判断"阴谋论语言"是全局统一还是随社区变化

即便每个社区都能区分,仍有两种截然不同的解释:要么存在一套放之四海皆准的"阴谋论语言",要么每个社区靠的是不同特征、是一种上下文适应的表达。为区分这两者,作者对每个社区模型计算 SHAP 值,得到一个 110 维的特征重要性向量,再用余弦相似度加层级聚类比较不同社区之间这些向量是否相似。如果各社区的重要特征高度一致,就支持"全局阴谋论语言"假说;如果特征因社区而异,则说明语言痕迹虽真实存在,却是随社区规范动态调整的——这正是后面"可区分但上下文依赖"结论的依据。

损失函数 / 训练策略

Random Forest 用网格搜索加 5 折交叉验证调参,按 80/20 划分训练与测试,特征归一化只在训练集上拟合以防泄漏,并用 100 次置换检验评估统计显著性。

实验关键数据

主实验

指标 数值 说明
平均分类准确率 87% 跨20+个社区的二分类
社区特定 vs 全局 最多+17pp 社区特定模型显著优于全局模型
统计显著性 p<0.01 所有社区的置换检验均显著

消融实验

配置 关键指标 说明
活跃度阈值 高活跃度效果更好 更多评论→更稳定的语言画像
r/AskReddit正类 准确率~随机 通用社区用户无法区分(负对照)
r/MensRights正类 中等准确率 意识形态社区也有部分区分力

关键发现

  • 阴谋论用户的语言确实在主流空间中可检测——平均87%准确率远超随机
  • 但没有单一全局模型能捕捉这些模式——社区特定模型比全局模型高出最多17个百分点
  • 这表明阴谋论用户的语言表达是动态适应的——虽然有独特特征,但会根据社区规范调整
  • r/AskReddit用户(负对照)无法被区分,验证了效果的特异性

亮点与洞察

  • "可区分但上下文依赖"是一个精妙的发现——既支持"阴谋论心态"的存在,又说明它不是简单的全局标签
  • 对内容审核策略有直接启示——统一的检测模型不够,需要社区定制的方法
  • 使用LIWC心理语言学特征(而非话题词)确保分析的是语言风格而非讨论内容

局限与展望

  • 将"在r/conspiracy评论过"等同于"阴谋论信仰者"可能过于宽泛
  • LIWC的词典方法可能错过新兴的语言模式
  • 仅分析Reddit一个平台,其他社交媒体上的模式可能不同
  • 未来可结合内容分析和风格分析进行更细粒度的研究

相关工作与启发

  • vs 内容检测方法: 关注语言风格而非内容,揭示了更深层的认知特征
  • vs 用户pathway研究: 不是追踪用户如何进入阴谋论社区,而是分析他们在主流空间的行为
  • vs 社区检测: 揭示了跨社区的行为适应性,补充了社区边界研究

评分

  • 新颖性: ⭐⭐⭐⭐ 从语言风格角度研究阴谋论用户的跨社区行为
  • 实验充分度: ⭐⭐⭐⭐⭐ 5亿条评论、10年纵向、22个社区、统计检验
  • 写作质量: ⭐⭐⭐⭐ 研究设计严谨,负对照完善
  • 价值: ⭐⭐⭐⭐ 对社交媒体治理和阴谋论研究有实际指导意义