主要观点总结
念空科技向国际顶会NIPS递交了与上海交大计算机学院合作的大模型研究论文,探讨自适应混合训练方法论。念空科技在大模型底层理论研究方面取得了成果,成为首家闯入NIPS的中国量化机构。念空科技王啸发现大模型可带来超过子任务数据本身的信息,具备跨模态理解能力,并将大模型训练经验应用于金融数据预测。念空科技同时成立AllMind进行大模型的基础研究和应用探索。大模型作为AI时代最重要的创新,将经历研究走出高校、研发走进高校的过程。念空科技认为金融大模型的难点在于如何在过拟合和欠拟合之间找到平衡点。
关键观点总结
关键观点1: 念空科技向NIPS提交大模型研究论文
念空科技与上海交大计算机学院合作,探讨了自适应混合训练方法论,并提交了研究论文。
关键观点2: 念空科技成为首家闯入NIPS的中国量化机构
念空科技在大模型底层理论研究方面取得了进展,成为首家在国际顶级会议NIPS上展露头角的中国量化机构。
关键观点3: 大模型在金融数据预测中的应用
念空科技王啸发现大模型具备超越子任务数据的信息和跨模态理解能力,可将大模型训练经验应用于金融数据预测。
关键观点4: 念空科技成立AllMind进行大模型研究与应用探索
念空科技同时成立了AllMind公司,专注于大模型的基础研究和应用探索,包括大模型训练算法优化、工程技术研究以及金融场景的垂直应用。
关键观点5: 金融大模型的挑战与前景
金融大模型面临过拟合和欠拟合的平衡点问题。念空科技认为,虽然金融数据存在数量少、信噪比低且不稳定的问题,但大模型仍具有潜力,需要在过拟合和欠拟合之间找到最佳的平衡点。
文章预览
量化行业再现AI之光,念空携大模型底层研究首闯国际顶会。 量化基金+大模型=? 在半年前,面对这道算术题,大部分人都会回答DeepSeek,但随着一篇研究论文的发表,一个新的答案出现了,那就是念空科技。 5月15日,量化私募念空科技向国际顶会NIPS投递了与上海交大计算机学院合作的大模型研究论文,探讨“ 自适应混合训练方法论 ”。 这次的故事,不是量化私募砸钱投大模型获得了如何丰厚的回报,而是念空科技“以身入局”,做出了大模型底层理论的研究成果,成为首家闯入NIPS的中国量化机构。 在念空之前,DeepSeek是唯一一家量化私募孵化进行大模型底层理论研究且发表研究成果的公司。相较于“前辈”,念空更进了一步。 在DeepSeek基础上,念空提出了一种全新的更优的训练方法,帮助大模型提升训练效率,是量化行业少有的真正的大模
………………………………