今天看啥  ›  专栏  ›  红衣大叔周鸿祎

国产大模型震惊海外 我怎么看?

红衣大叔周鸿祎  · 公众号  · 科技自媒体  · 2025-01-05 15:55
    

文章预览

前几天中国六代战机曝光,外网闹翻天了。这还不够,这两天中国大模型又出了新版本,致使海外 AI 社区刷屏。 国内 AI 创业公司 DeepSeek发布了新的开源大模型,其参数量为6000多亿,性能赶上了 GPT - 4o和Facebook的羊驼,但训练成本比它们降低了10倍,价格仅为它们的10%。 该模型推出后,明显能感觉到海外 AI 技术人才对中国 AI 技术的进步,处于半震惊半懵状态。 网友评论整齐划一,都在问中国人是如何做到的?Meta 的一位科学家惊叹,DeepSeek 的训练像是黑科技。OpenAI 的一位创始团队成员称,以前达到 DeepSeek 这种级别能力通常需16000个 GPU,而现在 DeepSeek 只用2000个 GPU,计算量减少了11倍,这证明 AI 算法还有很大优化空间。 大家可能不太了解 DeepSeek 这家公司,虽然我们有合作,但我对其了解不深,于是用纳米 AI 搜索查询了一下。 DeepSeek 中文 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览