注册登录

看啥推荐读物

专栏名称: 赛尔实验室

哈尔滨工业大学社会计算与信息检索研究中心

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

程序猿 · 神级代码注释，喜欢的拿去用· 2 天前

OSC开源社区 · 开源项目警惕被“社工”渗透，否则后门不保！· 2 天前

OSC开源社区 · 他潜伏三年想插它后门，最终还是输给了另一个他· 2 天前

程序员小灰 · 面试官：为什么忘记密码要重置而不是告诉你原密码？· 4 天前

程序员的那些事 · 趣图：装逼失败了吧？！· 6 天前

今天看啥 › 专栏 › 赛尔实验室

赛尔原创@EMNLP 2020 | 基于反事实推理的开放域生成式对话

赛尔实验室 · 公众号 · 程序员 · 2020-11-04 11:13

论文名称：Counterfactual Off-Policy Training for Neural Dialogue Generation论文作者：朱庆福，张伟男，刘挺，王威廉原创作者：朱庆福论文链接：https://arxiv.org/abs/2004.14507转载须标注出处：哈工大SCIR1. 简介开放域对话系统由于潜在回复数量过大而存在着训练数据不足的问题。我们在本文中提出了一种利用反事实推理来探索潜在回复的方法。给定现实中观测到的回复，反事实推理模型会自动推理：如果执行一个现实中未发生的替代策略会得到什么结果？这种后验推理得到的反事实回复相比随机合成的回复质量更高。在对抗训练框架下，使用反事实回复来训练模型将有助于探索潜在回复空间中的高奖励区域。在DailyDialog数据集上的实验结果表明，我们的方法显著优于HRED模型和传统的对 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

程序猿 · 神级代码注释，喜欢的拿去用

2 天前

OSC开源社区 · 开源项目警惕被“社工”渗透，否则后门不保！

2 天前

OSC开源社区 · 他潜伏三年想插它后门，最终还是输给了另一个他

2 天前

程序员小灰 · 面试官：为什么忘记密码要重置而不是告诉你原密码？

4 天前

程序员的那些事 · 趣图：装逼失败了吧？！

6 天前

大楚网 · 玩“羊了个羊”，遇到这种情况速报案

1 年前

博尔赫斯 · 月亮｜科恩

2 年前

李晓鹏1982 · //@都注册完完了:试想一下他若真是杀人犯，不仅没判死刑，出狱后-20200808112203

3 年前

次第花开 · 法王如意宝：胜过母亲的母牛

4 年前

维维说房 · 首席产品官宋卫平又推新款，代号「山镜」︱裘维维

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号