量化機构九坤投資和微軟成功複現DeepSeek-R1

記者獲悉,九坤投資與微軟亞洲研究院近日刊文稱,首次成功複現了DeepSeek-R1,特別是其在强化學習領域的成果,同時在科技層面提出了創新性的見解。 該學術文章名為Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning, 為微軟亞洲研究院、Ubiquant及其他獨立研究人員共同撰寫。 據悉,同為量化巨頭,九坤投資在數據、算灋、算力方面有著强大的科技儲備和人才儲備,近年來持續在AI前沿技術領域展開系統且深入的研究,不僅長期探索通用技術並推動其場景應用,還在多個細分領域進行了多元化的研究拓展,力求構建更為全面的AI科技體系。 在業內看來,DeepSeek的模型全部開源,全球掀起複現DeepSeek-R1的熱潮,此前包括HuggingFace、伯克利大學、上海交大等機构均有相關複現研究,並取得一定的成果。 (財聯社記者閆軍)

掃碼分享
www.ecbnnews.com