专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

本文创新性地将经典A*搜索算法应用于语言模型解码,通过巧妙定义路-20250522055109

爱可可-爱生活  · 微博  · AI  · 2025-05-22 05:51
    

文章预览

2025-05-22 05:51 本条微博链接 本文创新性地将经典A*搜索算法应用于语言模型解码,通过巧妙定义路径成本为启发式值的“累积改进量”并结合过程奖励模型(PRM)作为启发式指导,提出了A*-解码方法,该方法在显著提升Token效率和PRM调用效率(最多3倍Token节省,30% PRM调用减少)的同时,使小型语言模型在复杂数学推理任务上达到了比肩数十倍参数量大模型甚至专用推理模型的惊人性能。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览