跳转至

🧑 人体理解

💬 ACL2025 · 2 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (1) · 📷 CVPR2026 (61) · 🔬 ICLR2026 (8) · 🤖 AAAI2026 (16) · 🧠 NeurIPS2025 (19) · 📹 ICCV2025 (49)

🔥 高频主题: 人脸/视线 ×2

Beyond Surface Simplicity: Revealing Hidden Reasoning Attributes for Precise Commonsense Diagnosis

本文揭示了常识推理基准中表面简单但实际隐含复杂推理属性的问题,提出了一种基于隐藏推理属性的细粒度诊断框架,能够更精确地分析和评估模型的常识推理能力。

TransBench: Breaking Barriers for Transferable Graphical User Interface Agents in Dynamic Digital Environments

提出首个系统评估 GUI Agent 迁移性(跨版本/跨平台/跨应用)的 benchmark TransBench,涵盖 81 个中文 App、1459 张截图、22K+ 标注指令,实验表明在旧版本上微调可有效迁移到新版本和其他平台,而跨平台迁移中 Android 数据的泛化性最强。