治理之智 | 合成数据在生成式人工智能时代的价值与风险

arXiv每日学术速递 · 公众号 · · 2024-11-13 12:30

文章预览

导语：合成数据随人工智能技术跌宕演进，随生成式人工智能发展成为产业和政策热点：从价值上说，合成数据有助于突破人类数据限制，在产业中的使用场景、数量占比和实际效果都远超预期。从安全上说，合成数据并非“超级智能”逃逸的助力，不会引发新的安全问题，反而是人类控制风险的抓手。从产业发展说，合成数据难以“独自成席”，对其市场规模和催生的创新企业不适合做过高预期。但合成数据是一个合适切口，理解大模型对数据要素价值发挥机制的整体改变，也是一个契机，思考数据相应政策体系如何顺应极速发展的前沿科技。一、合成数据发展历程回顾合成数据（Synthetic Data）并没有准确定义，一般指通过计算机程序或者数学模型生成的数据集，不直接来源于实际观察或测量，但能够反映真实世界的统计特征或者运行规律， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博