专栏名称: 雷科技
雷科技,致力于让科技资讯变得更加有趣。来和10w+的科技数码爱好者一起享受有趣的科技资讯吧。
今天看啥  ›  专栏  ›  雷科技

AI界拼多多DeepSeek实力如何?几轮实测后我有了答案

雷科技  · 公众号  · 科技媒体  · 2025-01-01 20:51
    

文章预览

训练一个AI大模型需要多少钱? OpenAI CEO山姆·奥特曼曾表示,GPT-4的训练成本大约1亿美元(约合人民币7.3亿元),未来训练大模型的成本将高于10亿美元。尚未完成训练的GPT-5大模型,为时约半年的一轮训练就消耗了大约5亿美元,可见AI公司的支出成本有多高。 然而在AI行业却有一个异类,被广大网友奉为“AI行业的拼多多”,这家公司就是DeepSeek(深度求索),网传其大模型训练成本压缩到极致, 最新推出的DeepSeek-V3大模型训练成本仅为557.6万美元(约合人民币4070万元),大概是GPT-4的二十分之一,总计约消耗了278.8万个GPU小时,参数为6710亿,其中激活参数为370亿。 DeepSeek官网的价格表示显示,缓存命中输入价格仅为0.1元/百万tokens,缓冲未命中输入价格为1元/百万tokens,输出价格则为2元/百万tokens,在诸多AI大模型中属于最低的一档。(注明:1token ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览