- [专业中文内容]
《DEL-ToM:通过动态认知逻辑进行理论心智推理时的推理时缩放》
该研究针对小型语言模型(SLMs)在有限规模下难以完成深层次社会推理的理论心智(ToM)任务,提出了一种创新性的推理时增强框架DEL-ToM。与传统通过结构化模型改进建议不同,本框架通过推理过程中的动态计算分配来提升能力。核心方法采用动态认知逻辑(DEL, Dynamic Epistemic Logic)将复杂ToM任务解构为可验证的信念更新序列,创建了结构化且透明的推理路径。研究团队开发了过程信念模型(PBM, Process Belief Model)作为验证器,通过DEL模拟器自动生成的标签对每个信念更新步骤进行评分。在推理阶段,语言模型产生的潜在信念轨迹会经历PBM的严格评估,最终选择最高得分轨迹作为输出结果。这种计算资源在测试时的弹性分配机制,使SLMs能够模拟更审慎的推理过程。跨多种模型规模和基准测试的实验验证表明,DEL-ToM显著提升了基础模型在ToM任务中的表现,证明可验证的信念监督机制可有效增强语言模型的社会认知能力,且无需进行模型结构重训练。
- [科技领域高频英文短语解析]
・Dynamic Epistemic Logic (DEL):动态认知逻辑,一种用于建模知识与信念变化的形式化逻辑体系。在人工智能领域,该理论框架被广泛用于模拟智能体在动态环境中的信息更新过程。
・Belief Update Step:信念更新步骤,指在推理过程中对已有认知状态进行修正的关键操作。常用于多智能体系统研究中,描述信息获取后的认知状态转换过程。
・Structured and Transparent Reasoning:结构化和透明的推理,强调推理过程具有可解释的层级结构。这类特性对构建可靠AI系统至关重要,有助于审计和验证推理路径的合理性。
・Process Belief Model (PBM):过程信念模型,用于验证信念更新序列的评分机制。在认知计算领域,此类模型常用于监控和指导其他系统的推理过程。
・Verifiable Belief Supervision:可验证的信念监督,属于可靠机器学习的重要概念。其核心在于通过可验证的中间状态确保最终输出的合理性,特别适用于敏感领域的决策支持。
・Inference-Time Scaling:推理时缩放,代表AI系统优化的新型范式。不同于传统的训练时扩容,这种策略在部署阶段动态调整计算资源分配,具有更优的效率与灵活性特征。 -
[图片规则](该论文未提供具体图片路径,已自动忽略)
-
[tag标签]
– Theory_of_Mind_toM
– Dynamic_Epistemic_Logic_DEL