Meta 发布 CoT 验证模型：基于 Llama 3.1 的白盒推理纠错工具-IT新闻-PHP中文网

Meta 发布 CoT 验证模型：基于 Llama 3.1 的白盒推理纠错工具

心靈之曲

发布： 2025-11-28 19:24:01

原创

768人浏览过

meta ai 实验室近日在 hugging face 平台发布了一款全新大模型，旨在推动链式思维（chain-of-thought, cot）推理的验证与优化。该模型暂命名为“cot-verifier”，基于 llama3.18b instruct 架构开发，并融合了创新的 topk 转码器（transducer）机制，首次实现了对模型推理过程的白盒级可视化分析，使开发者能够精准定位并修正推理链条中的错误节点。

Meta 发布 CoT 验证模型：基于 Llama 3.1 的白盒推理纠错工具

目前主流的 CoT 验证技术多依赖黑盒评估方式，即仅通过最终输出判断推理正确性；或采用灰盒方法，借助激活信号间接推测内部逻辑状态。然而，这些手段难以揭示推理失败背后的深层成因。为此，研究团队提出了一种名为 CRV 的新范式，主张从归因图的角度切入——即将每个推理步骤视为模型内部推理电路的一次执行路径——并通过其结构特征差异来识别正误逻辑。

实验结果表明，正确推理所激发的归因图在拓扑结构上与错误推理存在显著不同。这种结构性偏差为预测推理准确性提供了强有力的判据。研究人员训练了一个专用分类器用于识别这些模式，证实了结构特征对错误具有高度预测能力，从而验证了直接通过计算图评估推理质量的可行性。

更进一步，研究发现这些结构模式展现出强烈的任务依赖性，即不同类型的推理任务会呈现出独特的失败模式。这说明推理错误并非随机发生，而是与特定任务的计算流程密切相关，为未来构建任务自适应的纠错机制指明了方向。尤为关键的是，团队利用归因图分析实现了对模型内部表征的定向调控，成功修复了部分原本出错的推理路径。