|
深度学习与计算架构和芯片设计[通识篇] 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
Primer: 针对语言模型的Transformer模型结构搜索 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
Synthesizer: 重新思考注意力机制 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
Social LSTM: 密集空间中的行人轨迹预测 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
推荐系统中离散特征无表编码 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
理解多任务学习中的信息迁移 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
HyperGird: 超网络与多任务Transformer的碰撞 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
超网络: HyperNetworks 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
MGQE: 多粒度量化编码 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
神经网络语言模型的自适应输入表示 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
DCN-v2: 增强版深度交叉网络 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |
|
DCN: 深度交叉网络 雨石记 · 公众号 · · 2 年前 · 访问文章快照 |