|
Llama 3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜 深度图学习与大模型LLM · 公众号 · · 16 小时前 · 访问文章快照 |
|
总结!大模型微调(Tuning)的常见方法 深度图学习与大模型LLM · 公众号 · · 16 小时前 · 访问文章快照 |
|
NeurIPS 2024还有一个月截稿?有哪些值得关注的研究方向? 深度图学习与大模型LLM · 公众号 · · 昨天 · 访问文章快照 |
|
2024 || 状态空间模型(State Space Model, SSM)的综述论文 深度图学习与大模型LLM · 公众号 · · 昨天 · 访问文章快照 |
|
AAAI24 | 关于曲率多样性的探索和研究——结合motif的多曲率图卷积网络 深度图学习与大模型LLM · 公众号 · · 2 天前 · 访问文章快照 |
|
2024 图神经网络+LLM有什么值得探索的方向? 深度图学习与大模型LLM · 公众号 · · 2 天前 · 访问文章快照 |
|
多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷 深度图学习与大模型LLM · 公众号 · · 3 天前 · 访问文章快照 |
|
炸裂!最新CVPR2024、ACL2024、AAAI2024、ICML2023论文+Code大合集! 深度图学习与大模型LLM · 公众号 · · 3 天前 · 访问文章快照 |
|
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」 深度图学习与大模型LLM · 公众号 · · 1 周前 · 访问文章快照 |
|
一文解析大模型算法知识体系:LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention及增量学习 深度图学习与大模型LLM · 公众号 · · 1 周前 · 访问文章快照 |
|
LOGS四月特辑:Let's Talk In AI 深度图学习与大模型LLM · 公众号 · · 1 周前 · 访问文章快照 |
|
谷歌更新Transformer架构,更节省计算资源!50%性能提升 深度图学习与大模型LLM · 公众号 · · 1 周前 · 访问文章快照 |
|
网友讨论:博士的年薪一般是多少万?“我哥们,某部委公务员,一个月7k”,“证券行业,税前120+” 深度图学习与大模型LLM · 公众号 · · 1 周前 · 访问文章快照 |
|
ICLR 2024 || VCR-Graphormer:通过虚拟连接的小批量图形转换器 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
重新聚焦Attention在微调大模型中的重要性 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
CVPR2024满分论文出炉!这些方向爆火! 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
吵翻!导师确认录取后被学生「删除拉黑」,导学双方“互放鸽子”太伤了.. 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
2024 图神经网络+LLM有什么值得探索的方向? 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
Mamba架构第一次做大!混合Transformer,打败Transformer 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |
|
港科大(广州)开源智慧交通新成果,用AI大模型控制红绿灯 深度图学习与大模型LLM · 公众号 · · 2 周前 · 访问文章快照 |