专栏名称: 人工智能学派
人工智能学派专注于分享:GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业!
目录
今天看啥  ›  专栏  ›  人工智能学派

大模型专题:『弈衡』人工智能大模型评测平台白皮书(附下载)

人工智能学派  · 公众号  ·  · 2024-06-14 16:18
    

文章预览

今天分享的是 大模型专题系列 深度研究报告:《 大模型专题:『弈衡』人工智能大模型评测平台白皮书 》 (报告出品方: 中移智库 ) 报告共计: 21 页 人工智能大模型评测需求: 应用需求:在技术验证、质量控制、风险管理和合规性等多个层面提出评测需求,包括验证模型性能、确保输出质量、管理安全风险和遵守法律法规等。 评测内容:在功能性、性能、安全性、可靠性等方面进行评测,包括任务特定性能、多任务能力、交互能力、准确度、效率、可扩展性、数据隐私、系统安全、伦理合规、鲁棒性和一致性等。 业界大模型评测平台现状: 业界典型大模型评测平台:OpenCompass、AgentBench、OpenEval、百度大模型内容安全评测平台。 各平台的优劣势分析:优势包括评测全面、多样化、高效、开源可复现等,局限性包括缺乏统一标准、安全性和 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览