|
如何增强大模型的多约束复杂指令跟随能力?| 大模型在现实知识冲突下的行为研究 | 使用GANs为扩散模型生成一致性角色... AIforResearch · 公众号 · · 2 天前 · 访问文章快照 |
|
Llama 3 负责人 Joe Spisak 的最新视频分享,里面介绍了很多 Llama 3 的细节….. AIforResearch · 公众号 · · 3 天前 · 访问文章快照 |
|
OpenAI 发布新作,揭秘 chatgpt 系统提示为何能够有效防止越狱 | LLM 偏好微调不同方法的利弊研究 AIforResearch · 公众号 · · 4 天前 · 访问文章快照 |
|
Llama3 预训练用了15T 的训练语料,现在有人把它开源了.... AIforResearch · 公众号 · · 4 天前 · 访问文章快照 |
|
一项关于什么样的下游样本有利于大模型微调的实证研究 | LLM 应用商店分析: 一个愿景与路线图 AIforResearch · 公众号 · · 5 天前 · 访问文章快照 |
|
本周大模型Top热门论文精选【2024—第16期】 AIforResearch · 公众号 · · 6 天前 · 访问文章快照 |
|
最新开源模型选择个人推荐(超过40B的建议购买API服务,其他建议自行int4部署...) AIforResearch · 公众号 · · 6 天前 · 访问文章快照 |
|
2024 年人工智能指数报告 —— 第2章:大模型最新的技术性能 [译] AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
昨天 Llama3 刚刚开源,今天 Llama3-8b 中文版本上线了! AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
纽约时报对 Anthropic CEO 一个半小时的采访 .... AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
Reka 发布了 Reka Core 128K多模态大模型,能力接近 GPT4 | 语言模型本质是一个Q-函数 ? AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
语言模型能解决奥赛编程问题吗?| 如何快速估算微调大模型的GPU内存使用量?| AlphaFold 训练时间缩短至 10 小时 AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
Mixtral 正式官宣Mixtral-8x22B,推出模型详细介绍文档! AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
DPO真的比PPO在对齐方面更优秀吗?一项全面研究 | Stability AI 发布5分钟时长歌曲生成技术... AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |
|
MT-Bench 榜单首个得分超越GPT-4的开源模型 —— WizardLM-2 发布! AIforResearch · 公众号 · · 1 周前 · 访问文章快照 |