专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
今天看啥  ›  专栏  ›  arXiv每日学术速递

治理之智 | 合成数据在生成式人工智能时代的价值与风险

arXiv每日学术速递  · 公众号  ·  · 2024-11-13 12:30
    

文章预览

导语: 合成数据随人工智能技术跌宕演进,随生成式人工智能发展成为产业和政策热点:从价值上说,合成数据有助于突破人类数据限制,在产业中的使用场景、数量占比和实际效果都远超预期。从安全上说,合成数据并非“超级智能”逃逸的助力,不会引发新的安全问题,反而是人类控制风险的抓手。从产业发展说,合成数据难以“独自成席”,对其市场规模和催生的创新企业不适合做过高预期。但合成数据是一个合适切口,理解大模型对数据要素价值发挥机制的整体改变,也是一个契机,思考数据相应政策体系如何顺应极速发展的前沿科技。 一、合成数据发展历程回顾 合成数据 (Synthetic Data)并没有准确定义,一般指通过计算机程序或者数学模型生成的数据集, 不直接来源于实际观察或测量,但能够反映真实世界的统计特征或者运行规律, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览