2月5日電,中信建投研報表示,DeepSeek R1訓練和推理算力需求較低,主要原因是DeepSeek R1實現算灋、框架和硬體的優化協同。 過去的預訓練側的scaling law正逐步邁向更廣闊的空間,在深度推理的階段,模型的未來算力需求依然會呈現爆發式上漲,充足的算力需求對於人工智慧模型的效能進步依然至關重要。
掃碼分享
2月5日電,中信建投研報表示,DeepSeek R1訓練和推理算力需求較低,主要原因是DeepSeek R1實現算灋、框架和硬體的優化協同。 過去的預訓練側的scaling law正逐步邁向更廣闊的空間,在深度推理的階段,模型的未來算力需求依然會呈現爆發式上漲,充足的算力需求對於人工智慧模型的效能進步依然至關重要。