TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale¶

会议: ACL 2026 arXiv: 2604.21889 代码: 无领域: LLM评测 关键词: 风险事件发现, 客户投诉挖掘, 事件链接, 流式处理, 信噪比优化

一句话总结¶

TingIS是一个部署在金融科技平台的端到端风险事件发现系统，通过五模块架构（语义蒸馏、级联路由、事件链接引擎、状态管理、多维降噪）从海量嘈杂客户投诉中实时提取可操作的风险事件，实现了P90告警延迟3.5分钟和95%的高优先级事件发现率。

研究背景与动机¶

领域现状: 大规模在线平台依赖复杂微服务和云原生架构，即使微小故障也可能迅速传播为大规模事件。内部可观测系统（metrics/logs/traces）是第一道防线，但并非万无一失。

现有痛点: 客户投诉数据虽是发现监控盲区的重要信号，但具有极端嘈杂、高吞吐量和语义复杂性等挑战。从2000条/分钟的流量中仅凭3条投诉发现系统性故障，面临严峻的信噪比（SNR）问题。低SNR系统会触发大量误报，导致运维团队告警疲劳。

核心矛盾: 需要在极高噪声、极短延迟和极低漏报之间取得平衡——同时满足实时性（分钟级）、高发现率（>95%）和低误报率。

本文目标: 构建一个能从日均30万条客户投诉中实时发现风险事件的企业级系统。

切入角度: 将问题分解为五个正交模块，每个模块解决一个核心子问题，通过"轻量规则预过滤+LLM深度判断"的混合智能策略平衡精度与成本。

核心idea: 通过多阶段事件链接引擎（LSH高速聚类→LLM纯度检查→跨批次历史关联→时间衰减加权）实现语义收敛和身份持久化，辅以级联路由和多维降噪保障系统整体SNR。

方法详解¶

整体框架¶

TingIS由三层（数据观测层、语义引擎层、长期记忆层）和五个正交模块组成：M1语义蒸馏、M2级联路由、M3事件链接引擎、M4事件状态管理、M5多维降噪。设计遵循三大核心洞察：语义收敛与身份持久化、混合智能协同、多约束SNR平衡。

关键设计¶

1. 语义蒸馏模块 (M1)

功能: 将原始客户投诉文本转化为无歧义的语义单元
核心思路: 使用Qwen3-8B生成"主体+问题"格式的初始摘要（如"信用卡在线支付+折扣错误"），过滤情绪表达、PII和无关细节，然后通过BGE-M3模型转为向量
设计动机: 原始投诉文本嘈杂、口语化、多样性高，需要在可控计算成本下创建高密度语义表示

2. 级联路由模块 (M2)

功能: 将投诉精确归属到对应业务域（biz_code）
核心思路: 两阶段策略——关键词匹配（高精度，处理明确投诉）→ 向量检索+BGE-Reranker重排（高召回，处理模糊投诉）。Reranker限制在Top-10候选池内以满足延迟约束
设计动机: 不同业务域语义差异大，精确路由是后续事件发现的前提

3. 多阶段事件链接引擎 (M3)

功能: 判断多条投诉是否指向同一底层风险事件
核心思路: 分两步——(a) 批内高效聚合：按biz_code分区→LSH高速聚类→LLM纯度检查（不纯则拆分并生成标题）；(b) 跨批次历史关联：用时间衰减加权的语义相似度 \(s^* = s \cdot e^{-k\Delta t}\) 匹配历史事件，超阈值则由LLM最终裁决合并/新建
设计动机: 这是系统核心挑战——需要从不同时间、不同表述的投诉中准确判断"事件身份"，LSH保障效率，LLM保障精度，时间衰减防止"历史惯性"

实验关键数据¶

主实验（线上部署一个月）¶

指标	数值
日均处理投诉数	30万+
峰值吞吐量	2000条/分钟
P90告警延迟	3.5分钟
高优先级事件发现率	95%

消融实验¶

评估维度	对比方法	TingIS表现
路由准确率	基线方法	显著优于基线
聚类质量	基线方法	显著优于基线
信噪比 (SNR)	基线方法	显著优于基线

关键发现¶

3条投诉即可触发告警: 系统能从仅3条相关投诉中发现潜在风险事件，这对早期预警至关重要
混合智能策略有效降低LLM成本: 规则预过滤大幅减少输入量，LSH和相似度阈值门控昂贵的LLM调用，历史状态的持久化带来渐进效率增益
告警穿透机制兼顾防疲劳与应急: 正常情况下2小时静默期防止告警疲劳，但检测到爆发式增长时自动穿透静默窗口
模块化设计支持低成本维护: 五个正交模块可独立升级（如替换更强LLM或更快embedding模型）

亮点与洞察¶

完整的工业级系统设计: 不仅是算法创新，而是涵盖数据观测→语义处理→事件管理→降噪→告警的完整工程方案
三层数据模型设计精巧: 状态层（实时决策）、审计层（不可变证据链）、快照层（历史基线），解耦了不同维度的数据需求
时间衰减语义关联机制: \(s^* = s \cdot e^{-k\Delta t}\) 简洁地融合了语义相似度和时间接近度，避免旧事件错误吸收新投诉
混合智能范式值得借鉴: "规则→检索→LLM"的渐进式智能调用策略，在保持精度的同时控制了计算成本

局限与展望¶

具体实验数据未充分展示: 论文HTML版本在实验部分截断，离线基准的详细数据未完整呈现
领域特异性强: 系统针对金融科技平台客户投诉设计，迁移到其他领域需要调整路由知识库和降噪策略
对LLM的依赖: 核心的纯度检查和合并裁决依赖LLM（Kimi-K2），可能面临延迟波动和成本问题
冷启动问题: 新业务域缺乏历史事件和关键词知识库时，系统效果可能下降
未讨论多语言场景: 虽然投诉可能涉及多语言，但论文未讨论多语言支持

评分¶

新颖性: ⭐⭐⭐ — 系统设计整合了多种已有技术，创新性更体现在工程集成和模块协同上
实验充分度: ⭐⭐⭐ — 有线上部署数据证明系统可行性，但离线对比实验细节不够完整
写作质量: ⭐⭐⭐⭐ — 系统架构描述清晰，模块间关系阐述明确，用实际案例增强可读性
价值: ⭐⭐⭐⭐ — 对构建企业级LLM应用系统有很强的参考价值，展示了LLM在实时流处理场景的工程实践

亮点与洞察¶

待深读论文后补充

局限性 / 可改进方向¶

待深读论文后补充

评分¶

新颖性: 待评
实验充分度: 待评
写作质量: 待评
价值: 待评

TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale¶

一句话总结¶

研究背景与动机¶

方法详解¶

整体框架¶

关键设计¶

实验关键数据¶

主实验（线上部署一个月）¶

消融实验¶

关键发现¶

亮点与洞察¶

局限与展望¶

相关工作与启发¶

评分¶

亮点与洞察¶

局限性 / 可改进方向¶

相关工作与启发¶

评分¶