|
阿里发布FunAudioLLM:语音理解与生成基础模型!Anthropic发布最新研究:语言模型迭代自优化过程的“奖励欺骗”现象 AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第27期 AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
1万亿参数!Tele-FLM系列模型中学到的经验分享... AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
大模型是否真的有自我意识?|规模定律再探索:最优的模型和数据大小之间关系应该是线性?如何在几分钟内移除Llama 3的安全锁? AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
苹果发布RLAIF最新研究:改进轻量级LLM代码生成能力 | 大模型的顺序指令跟随能力..... AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第26期 AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
从模型训练时间预估最终模型loss, DeepMind 发布最新时间规模定律!适用于任何预算! AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
具有几乎无限上下文长度的LLM可以实现AGI ? AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
AI考上一本了!文心一言理科第一、文科第二!2024年河南卷(地狱级)AI高考挑战赛结果出来了! AI for Research · 公众号 · · 10 月前 · 访问文章快照 |
|
英伟达:解锁语言模型中的持续学习能力!指令跟随模型的长度限制问题探究 | 大模型中的“电路”的含义 AI for Research · 公众号 · 科技自媒体 科技媒体 · 10 月前 · 访问文章快照 |
|
AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
通过缓解稳定性差距实现高效持续预训练 | 大模型的混合对齐训练 | 探索构建特定语言的大模型的设计选择! AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第25期 AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
重新思考大模型微调的数据选择 | 如何通过特定任务微调恢复损坏的语言模型 | 探究Mamba的长度推断潜力 AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
Ilya 官宣新公司SSI(安全超级智能),但是拒绝公布这些深度背景信息.... AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
DeepSeek-Coder-V2报告发布!支持338种编程语言 | ChatGLM系列发展:从GLM-130B到GLM-4 AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
英伟达发布 Nemotron-4 340B 技术报告 | 谷歌发布开源代码模型CodeGemma | 探寻下一代语言模型训练集 AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
OpenAI 研究员在斯坦福的最新讲座,核心观点:AGI背后的最大驱动力不是聪明的算法而是….. AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
不要像金鱼一样7秒记忆!缓解生成式大模型中的记忆问题 | 梯度正则化何时会有害?探讨.... AI for Research · 公众号 · · 11 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第24期 AI for Research · 公众号 · · 11 月前 · 访问文章快照 |