外媒報導,DeepSeek R2模型發布延宕。(示意圖,彭博)
陳麗珠/核稿編輯
〔財經頻道/綜合報導〕外媒報導,中國人工智慧(AI)新創公司深度求索(DeepSeek)原本計劃5月推出最新R2模型,因執行長梁文峰對其效能不滿意,所以尚未決定其正式發表時間,近期恐難打入市場。外媒指出,即便R2獲得批准,美國4月起限制輝達H20高階晶片出口至中國,也有效阻止DeepSeek發展。
外媒《The Information》引述知情人士指出,R2原本被視為DeepSeek超人氣推理模型R1的接班版本,目標提升程式碼生成與非英語語言推理方面有所突破。
DeepSeek工程師過去數月持續優化R2,等待梁文峰拍板放行。不過,報導強調,即便R2獲得批准,市場推廣也面臨巨大挑戰,因為中國雲端服務供應商恐怕也無法應付客戶需求。
主因在於客戶目前多半是透過雲端上部署的輝達降規版AI晶片H20來運行上一代模型R1,但由於美國出口管制,這些雲端服務供應商正面臨輝達晶片日益短缺問題。
報導指出,目前大多數DeepSeek企業客戶使用R1模型,配備的正是輝達的H20晶片。然而,美國4月加碼出口限制,連H20這類唯一合法出口中國的AI晶片也被封殺。
一手掌握經濟脈動 點我訂閱自由財經Youtube頻道
不用抽 不用搶 現在用APP看新聞 保證天天中獎 點我下載APP 按我看活動辦法