看啥推荐读物
专栏名称: 阿里研究院
阿里研究院依托阿里巴巴集团海量数据、深耕小企业前沿案例、集结全球商业智慧,以开放、合作、共建、共享的方式打造具影响力的新商业知识平台。 阿里研究,洞察数据,共创新知! 官方网站http://www.aliresearch.com/
今天看啥  ›  专栏  ›  阿里研究院

合成数据:治理之智

阿里研究院  · 公众号  · 电商  · 2024-03-21 17:43
在上一期《合成数据:大模型训练和应用的新方案》中,我们讨论了合成数据在大模型预训练和对齐阶段的作用,合成数据对大模型数据可用性的拓展,以及合成数据在推荐系统中的应用。本篇作为本系列的收官之作,我们从价值和风险视角,基于对合成数据技术特征和应用的理解,探讨合成数据可及性和安全性问题,以期为合成数据治理的政策提供有益的建议。# ONE 合成数据是解决高质量训练数据供给不足的新方案高质量数据是大模型技术发展的主要瓶颈之一,可供大模型学习的数据类型较多,但能够进一步拓展大模型知识边界、推动大模型推理、泛化等关键能力提升的数据更多偏向于视频、图片等多模态数据,以及特定行业中的领域知识数据。此类数据主要来自于人类的创造、制作和经验积累,其规模、类型和质量因客观条件的不同存在较大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照