|
|
· 公众号 · 大模型 · 3 周前 · |
|
|
· 公众号 · 大模型 · 4 周前 · |
|
|
· 公众号 · 大模型 · 2 月前 · |
|
|
· 公众号 · 大模型 · 2 月前 · |
|
|
RL推理的尽头,是熵坍缩?统一SFT与强化学习的新视角 深度图学习与大模型LLM · 公众号 · 大模型 · 2 月前 · |
|
|
arxiv 202508: 语义结构在大型语言模型嵌入中的体现 深度图学习与大模型LLM · 公众号 · 大模型 · 2 月前 · |
|
|
· 公众号 · 大模型 · 2 月前 · |
|
|
· 公众号 · 大模型 · 3 月前 · |
|
|
科研写作神器,超越Mathpix的科学公式提取工具已开源 深度图学习与大模型LLM · 公众号 · 大模型 · 3 月前 · |
|
|
· 公众号 · 大模型 · 3 月前 · |
|
|
· 公众号 · 大模型 · 3 月前 · |
|
|
· 公众号 · 大模型 · 4 月前 · |
|
|
EraRAG:适应动态语料的高效图结构检索生成方法 深度图学习与大模型LLM · 公众号 · 大模型 · 4 月前 · |
|
|
· 公众号 · 大模型 · 4 月前 · |
|
|
· 公众号 · 大模型 · 4 月前 · |
|
|
Apple研究||理解推理模型的能力与局限性 深度图学习与大模型LLM · 公众号 · 大模型 · 4 月前 · |
|
|
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造 深度图学习与大模型LLM · 公众号 · 大模型 · 4 月前 · |
|
|
· 公众号 · 大模型 · 6 月前 · |
|
|
· 公众号 · 大模型 · 6 月前 · |
|
|
· 公众号 · 大模型 · 6 月前 · |