文章预览
4月2日,文心大模型X1正式上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API。 文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态, 是能力更全面的深度思考模型 。模型兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。 据权威测试, 在多个公开数据集测评中,文心大模型 X1在数学、代码、知识推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。 在数学场景中, GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,MBPP数据集测试后结果显示,文心X1得分83.3,DeepSeek-V3-0324得分81.2;在知识推理层面,C-Eval数据集测试后结果显示,文心X1得分88.6,DeepSeek-V3-0324得分85.1;在数学推理层面,Aime2024数据集测试后
………………………………