今天看啥  ›  专栏  ›  AIforResearch

Apple 开源 OpenELM, 可直接在苹果设备微调推理 | 对齐洞察:DPO及其变体在多任务上的表现研究......

AIforResearch  · 公众号  ·  · 2024-04-24 20:37
前言:看论文就像是一次美食之旅,每一篇论文都是一道不同的菜肴。有些论文会让你大快朵颐,有些论文会让你欲罢不能,而有些论文则会让你咬牙切齿。但是别忘了,只有尝试了各种不同的菜肴,才能成为一个真正的“吃货”哦!1. OpenELM: 一种具有开源训练和推理框架的高效语言模型家族  标题:OpenELM: An Efficient Language Model Family with Open-source Training  and Inference Framework  机构:Apple  相关领域:模型结构改进、预训练  作者:Sachin Mehta, Mohammad Hossein Sekhavat, Qingqing Cao  分析:作者发布了OpenELM,一种最新的开放语言模型。OpenELM使用分层缩放策略,可以在Transformer模型的每一层内高效分配参数,从而提高准确性。使用约10亿个参数预算时,OpenELM相比OLMo的提高2.36%准确性,同时需要2倍更少的预训练令牌。作者的发布包括完整的框架用于在公开可用数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照