专栏名称: 互联网行业观察
互联网行业深度洞察,最前沿资讯、行业深度分析、内幕小道全覆盖,重磅新闻跟踪报道!
今天看啥  ›  专栏  ›  互联网行业观察

省去90%服务器还能提升反欺诈效率?看PayPal打破“AI内存墙”实战

互联网行业观察  · 公众号  · 科技自媒体  · 2022-06-24 20:00
作者 | 张倩来源 | 机器之心内存不够只能割肉买 DRAM?英特尔:很多时候大可不必。人们常说,新一代的人工智能浪潮是由数据、算法和算力来驱动的。最近几年模型参数的爆炸式增长更是让大家看到了算力的基础性作用。为了配合企业用户对于算力的强烈需求,当前的很多 AI 硬件(比如 GPU)都铆足了劲儿地提高峰值算力,但这种提升通常以简化或者删除其他部分(例如内存的分层架构)为代价[1],这就造成 AI 硬件的内存发展速度远远落后于算力的增长速度。SOTA Transformer 模型参数量(红点)和 AI 硬件内存大小(绿点)增长趋势对比。图源:https://github.com/amirgholami/ai_and_memory_wall/blob/main/imgs/pdfs/model_size_scaling.pdf因此,在遇到大模型的训练和推理时,用户总是感觉显存或内存不够用,这就是所谓的「内存墙」问题。为了打破内存墙,人们



文章原文内容无法展示,请购买VIP后获取原文链接; 或者 使用第三方RSS订阅工具获取原文链接