专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
今天看啥  ›  专栏  ›  爱可可-爱生活

本文提出一种名为SIKeD的自引导迭代知识蒸馏方法,通过迭代地结-20241026054441

爱可可-爱生活  · 微博  · AI  · 2024-10-26 05:44
    

文章预览

2024-10-26 05:44 本条微博链接 本文提出一种名为SIKeD的自引导迭代知识蒸馏方法,通过迭代地结合LLM数据和小模型自身生成的正确推理结果,有效地解决了小模型在数学推理能力蒸馏过程中策略选择单一的问题,并在多个数据集上取得了显著的性能提升,其反直觉的发现是简单地混合多种策略的数据并不一定能提高性能,迭代自引导训练至关重要。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览