美國專家分析撰文分析DeepSeek,點出DeepSeek推出的AI模型實際情況。(路透)

高佳菁/核稿編輯

〔財經頻道/綜合報導〕中國AI新創DeepSeek崛起,引發各界關注,有專家撰文分析DeepSeek,以及美國AI未來趨勢,點出DeepSeek推出的AI模型實際情況,而這篇貼文也吸引到特斯拉(Tesla)執行長馬斯克(Elon Musk)回應稱,這是自己看過「最有道理的分析」。

投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在社群平台X撰文表示,DeepSeek-R1是真的,只是有一些實際情況仍有細微的出入,首先,DeepSeek確實登上蘋果(Apple)App Store相關應用程式類別的下載榜首,超越了ChatGPT,Gemini、Claude等其他AI模型所無法達成。以品質來看,貝克認為,DeepSeek-R1與OpenAI的o1模型相當,但是仍輸給o3。貝克表示,DeepSeek在演算法方面確實有突破,使得這款模型在訓練、推論方面都非常有效。

請繼續往下閱讀...

文中提到,R1也有與該公司聲稱的出現些微差距的地方,例如DeepSeek表示,AI模型訓練花費不到600萬美元(約新台幣1.96億元),但實際上,600萬美元並不包括與架構、運算和資料有關的研究以及消融實驗的成本。這也代表,如果一個實驗室已經花費了數億美元進行研究,並可以使用更大的群集,那當然可以用600萬美元建造出與R1同樣品質的模型。

貝克補充,DeepSeek在研發AI模型時,汲取了GPT-4o和o1的精華,這也代表,如果確實限制中國使用GPT-4o和o1,DeepSeek將無法順利訓練模型。貝克也點出,美國現在限制了中國取得先進GPU(圖型處理器)的能力,但卻對於中國取經尖端模型的能力沒有任何行動。

貝克表示,降低訓練成本將增加AI的投資報酬率,但短期內,這對於訓練方面的資本支出或能源相關議題沒有正面的影響。如果像是R1一樣「濃縮版」的模型可以在像是Mac Studio Pro這類的高階工作站運作,這表示,類似的模型大約在2年內在超級手機上運行,可能將看到史上最大的個人電腦(PC)、智慧手機升級週期。

最後,貝克也提到,美國實驗室未來可能會停止發表尖端模型,以防止像是R1一樣提煉精華的情況,儘管現在可能已經來不及,即R1可能足以訓練出R2等新的模型。

貝克的貼文也吸引到馬斯克回覆表示,這是一篇有趣的分析,是自己看過「最有道理的分析」。

Interesting analysis. Best I’ve seen.



AJ will be everywhere.