看啥推荐读物
专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

大模型思维链推理及文档理解的2个问题:大模型COT链式推理变体及文档理解的阅读顺序方案

老刘说NLP  · 公众号  ·  · 2024-04-26 12:03
今天是2024年4月26日,星期五,北京,天气晴。我们先来看看llama3发布近一周后进展。https://ai.meta.com/blog/meta-llama-3-update/,模型已经被下载超过120万次,开发者在Hugging Face上分享了超过600个衍生模型, Llama 3的GitHub仓库已经获得超过17000Stars。今天我们来谈两个实际问题,一个是大模型COT链式推理能衍生出什么变体,另一个是关于文档理解版式还原中的阅读顺序,这些都是在实际落地中需要面临的问题。言简意赅总结问题,并给出方案指引,供大家一起参考并思考。一、问题1:大模型COT链式推理能衍生出什么变体当前,从cot(chain of thought)衍生出来的系列方案,在面向复杂推理的场景中扮演着重要角色,但这种思想也可以进一步发展,出现很多变体,如下:例如与RAG结合,那么就会演变成coa(chain of augmentation),例如涉及到instruction之灵的增强、history历史 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照