看啥推荐读物
专栏名称: 智源社区
【智源社区】是北京智源人工智能研究院打造的一个内行、开放的 AI 实名社区,致力于促进 AI 交流。
今天看啥  ›  专栏  ›  智源社区

共建AI开源数据集,OpenLabel数据标注共享平台招募志愿者

智源社区  · 公众号  ·  · 2023-03-14 16:00
目前以 ChatGPT 为代表的大模型引起了学术界和工业界的广泛关注,构建大模型往往需要海量数据、大量算力和创新算法,其中数据是构建大模型必不可少的资源。然而,高质量数据集的建设成本高昂,此外很多数据由不同的机构构建,存储分散,而且由于商业竞争等原因,数据上形成了各自为战的局面,大家无法将分散的数据整合到一起发挥更大的作用。基于以上背景,智源研究院发起了公益项目“OpenLabel数据飞轮”,旨在克服大模型创新中的数据难题,打造一个开源数据平台,汇聚多方力量,打破数据壁垒,推动中国大模型创新进程。人人贡献共享,不啻微芒,造炬成阳!OpenLabel 数据共享标注平台已经发布(openlabel.baai.ac.cn),第一阶段主要关注中文语言模型中的微调 Instruct 任务数据,在 ChatGPT 的大潮下,这部分高质量、分布性广的数据是最为 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照