DeepSeek-V3 和 DeepSeek-R1 陸續發布,國產大模型能力已可比肩海 外領軍大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式發布 DeepSeek-V3 大模型首個版本并同步開源。根據 DeepSeek 網 站信息,DeepSeek-V3 為自研 MoE 模型,671B 參數,激活 37B,在 14.8T tokens 上進行了預訓練。DeepSeek-V3 多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,并在性能上和世界 頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 相當。在訓練成本方 面,根據 DeepSeek 發布的技術文檔論文信息,DeepSeek-V3 的訓練時 長為 2788K 個 H800 GPU 小時,訓練花費約為 557.6 萬美元。2025 年 1 月 20 日,DeepSeek 正式發布復雜推理類大模型 DeepSeek-R1,性能對 齊 OpenAI o1 正式版。以 DeepSeek 系列大模型為代表的國產大模型性 能已可比肩海外領軍大模型,且成本更低。
DeepSeek 系列大模型引發全球廣泛關注,海內外巨頭科技公司及云服務 平臺廠商已相繼接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春節期間,DeepSeek 系列大模型火爆出圈,引 發全球廣泛關注。根據新浪財經 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 個市場中成為下載量最多的移動應用。根據 Appfigures 的 數據,DeepSeek 的推理人工智能聊天機器人在 1 月 26 日登上蘋果公司 App Store 的榜首,并自那時以來一直保持全球第一的位置。同時,全球 也開始了對 DeepSeek 大模型的復刻。以港科大團隊為例,港科大助理教 授 何 俊 賢的 團 隊, 只 用了 8K 個 樣 本, 就 在 7B 模型 上 復刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的訓練。當前,海內外巨頭科技公 司及云服務平臺廠商已相繼接入了 DeepSeek 大模型,部分 AI 應用領域 相關企業也已開始了 DeepSeek 大模型的部署和應用。DeepSeek 大模型 獲得了全球的廣泛關注,認可度持續提升。我們認為,DeepSeek大模型的開源、低成本和高性能將大幅降低大模型的獲得、部署和應用成本,將加快大模型在 B 端和 C 端應用場景的落地。另外,DeepSeek 大模型的出 圈將對全球大模型產業的競爭格局產生重要影響,將對海外領軍大模型廠 商的領先性產生沖擊,并同時將對算力的未來發展產生重要影響。
DeepSeek 大模型的出圈預計不改算力整體需求向上的態勢,但推理和端 側算力有望增長更快。DeepSeek 在算法效率和計算成本方面有著較大的 優勢,短期內可能對訓練算力的增長有一定的平抑效應,但是不改 AI 算 力整體需求長期上升的態勢。AI 作為全球智能化發展的主要抓手,大模型 當前已應用于端側、教育、金融、辦公、傳媒、醫療、智能汽車、企業服務等多個應用場景,應用領域廣闊。DeepSeek 低成本而且開源的解決方 案,大幅降低了 AI 在各行各業應用的技術和成本門檻,為 AI 的產業化落地提供了更快的路徑。推理和端側的算力需求增長潛力非常大。同時,較低訓練成本以及開源的 DeepSeek,有望帶來更低 的大模型開發和使用門檻,基于該大模型開發的主體可能更多,也一定程度上為訓練算力需求提供了支撐。DeepSeek 并不 是壓縮了算力市場,反而為算力市場增加了更多的想象空間。DeepSeek 也在積極與國產 AI 算力平臺合作。DeepSeek 大模 型與國產 AI 芯片適配的逐步成熟,將加快推動國產 AI 芯片在國內大模型訓練端和推理端的應用,加快國產 AI 芯片產業鏈的 成熟,為國產 AI 芯片產業帶來發展機遇,同時加快我國大模型產業的發展。
![]() |
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務機器人底盤 核酸采樣機器人 智能配送機器人 導覽機器人 |