跳转至

📡 信号/通信

💬 ACL2025 · 2 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (3) · 📷 CVPR2026 (5) · 🔬 ICLR2026 (8) · 🤖 AAAI2026 (3) · 🧠 NeurIPS2025 (13) · 📹 ICCV2025 (3)

ToolSpectrum: Towards Personalized Tool Utilization for Large Language Models

提出ToolSpectrum基准,首次定义并评估LLM的个性化工具使用能力——根据用户画像和环境因素选择最合适的工具,实验表明个性化显著提升用户体验,但现有LLM在联合推理用户和环境因素时能力有限。

WirelessMathBench: A Mathematical Modeling Benchmark for LLMs in Wireless Communications

本文提出WirelessMathBench,一个包含587道题目的无线通信数学建模基准,从40篇前沿论文中提取,系统评估LLM在领域特定数学推导上的能力,揭示即使最强的DeepSeek-R1平均准确率也仅38.05%,完整公式推导仅7.83%。