✍️ 文本生成¶
🔬 ICLR2026 · 3 篇论文解读
📌 同领域跨会议浏览: 💬 ACL2026 (15) · 🤖 AAAI2026 (2) · 📹 ICCV2025 (1) · 💬 ACL2025 (26) · 📷 CVPR2025 (1)
- AP-OOD: Attention Pooling for Out-of-Distribution Detection
-
提出AP-OOD,将Mahalanobis距离的均值池化替换为可学习的注意力池化,解决了均值池化丢失token级异常信息的问题,在文本OOD检测中将XSUM摘要的FPR95从27.84%降至4.67%,支持无监督到半监督的平滑过渡。
- FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Model
-
提出 FS-DFM(Few-Step Discrete Flow-Matching),通过步数感知训练和累积标量更新规则,将离散 flow-matching 语言模型的采样步数从 1024 步降低到 8 步,实现 128 倍加速,同时保持相当的困惑度和生成质量。
- Rethinking Uncertainty Estimation in LLMs: A Principled Single-Sequence Measure
-
从 proper scoring rules 框架出发,证明最高概率输出序列的负对数似然(MSP)是理论上合理的不确定性度量,并提出 G-NLL——仅用一次贪心解码就能逼近该度量,在多个场景下匹配或超越需要多次采样的 SOTA 方法。