科研进展
基于 Wilf–Zeilberger 方法与大语言模型的组合恒等式自动形式化证明
(刘俊杞、王艺森、陈绍示、支丽红与合作者)
发布时间:2026-06-01 |来源:

    组合恒等式的形式化证明是自动定理证明领域中的一项重要挑战。此类证明往往需要复杂的长程规划,而无约束的证明搜索空间会迅速膨胀,使得现有基于大语言模型的定理证明方法在该方向上的表现仍较为有限。如何有效结合符号计算的结构化推理能力与大语言模型的灵活生成能力,实现组合恒等式的自动化、机器可验证证明,是数学机械化与人工智能交叉领域亟待解决的重要问题。

    针对这一挑战,中国科学院数学与系统科学研究院数学机械化实验室陈绍示研究员、支丽红研究员,联合华东师范大学杨争峰教授、河南大学王建林副教授,以及研究生熊贝贝、吕航宇、刘俊杞、王艺森,提出了 WZ-LLM:一种融合 Wilf–Zeilberger 方法与大语言模型的神经符号证明框架,用于在 Lean 4 定理证明器中自动完成组合恒等式的形式化证明。

    WZ-LLM 将经典 Wilf–Zeilberger 方法所提供的结构化证明思路与大语言模型的自动证明能力相结合。该框架首先利用 WZ 方法将目标恒等式分解为可执行的证明骨架,再由专门训练的证明模型 WZ-Prover自动完成递推关系、边界条件以及非零性约束等关键子目标的形式化证明。对于难以直接由 WZ 方法覆盖的恒等式,模型还能够尝试进行端到端形式化证明,从而提升系统的适用范围和自动化能力。

    实验结果表明,在包含 100 个经典组合恒等式的 LCI-Test基准测试集上,WZ-LLM 实现了 34%的端到端证明成功率,显著优于 DeepSeek-V3、Goedel-Prover-V2 以及 Gemini 系列模型等强基线方法。该工作展示了符号计算方法与大语言模型深度结合在形式化数学证明中的潜力,为组合恒等式的自动化证明提供了一条新的技术路径。

    相关论文已被机器学习顶级会议 ICML 2026接收为 spotlight论文。

Publication:

ICML 2026

https://arxiv.org/abs/2605.04472

Code:

https://github.com/BeibeiX0/WZ-LLM


Author:

Beibei Xiong 

School of Software Engineering, East China Normal University, Shanghai, China


Hangyu Lv

School of Software Engineering, East China Normal University, Shanghai, China


Junqi Liu

Institute of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing, China


Yisen Wang

Institute of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing, China


Shaoshi Chen

Institute of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing, China


Jianlin Wang

School of Computer and Information Engineering, Henan University, Kaifeng, China


Zhengfeng Yang

School of Software Engineering, East China Normal University, Shanghai, China

Correspondence to: Zhengfeng Yang <zfyang@sei.ecnu.edu.cn>.


Lihong Zhi

Institute of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing, China



附件下载:

    联系我们
    参考
    相关文章