今天看啥  ›  专栏  ›  InfoQ

3 个月砸 1000 万美元肝出“最强”大模型?黑马 Databricks:我们完虐 Grok、Llama,还更开放

InfoQ  · 公众号  · 科技媒体  · 2024-03-30 10:15
整理 | 凌敏、核子可乐 世界最强开源大模型又双叒叕易主了! Databricks 推出开源大模型 DBRX 3 月 27 日,美国 AI 初创公司 Databricks 宣布,该公司 Mosaic Research 团队开发的通用大模型 DBRX 将开源。Databricks 客户可以通过 API 使用 DBRX,从零开始预训练自己的 DBRX 同类模型,或者使用其构建该模型的同款工具和技术在选定的检查点之上继续训练。据悉,DBRX 的设计灵感来源于 OpenAI 的 ChatGPT。Databricks 表示,它花费了大约 1000 万美元和三个月的时间来训练 DBRX,并声称其“在标准基准上优于所有现有的开源模型”。Databricks 的首席神经网络架构师兼 DBRX 项目负责人 Jonathan Frankle 在确认了测试结果后向团队宣布:“我们已经超越了所有现有模型”。量化测试结果显示,DBRX 性能已经超越 GPT-3.5,且完全能够与 Gemini 1.0 Pro 相比肩。其推理速度比达到 LlaMa2-70B 的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照