當前位置：首頁 > 新聞資訊 > 人工智能應用 > DeepSeek 引發廣泛關注,大模型應用落地將加速,加快大模型在 B 端和 C 端應用場景的落地

DeepSeek 引發廣泛關注,大模型應用落地將加速,加快大模型在 B 端和 C 端應用場景的落地

來源：平安證券編輯：創澤時間：2025/3/6 主題：其他 [加盟]

DeepSeek-V3 和 DeepSeek-R1 陸續發布，國產大模型能力已可比肩海外領軍大模型。2024 年 12 月 26 日，杭州 AI 公司深度求索（DeepSeek）正式發布 DeepSeek-V3 大模型首個版本并同步開源。根據 DeepSeek 網站信息，DeepSeek-V3 為自研 MoE 模型，671B 參數，激活 37B，在 14.8T tokens 上進行了預訓練。DeepSeek-V3 多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型，并在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 相當。在訓練成本方面，根據 DeepSeek 發布的技術文檔論文信息，DeepSeek-V3 的訓練時長為 2788K 個 H800 GPU 小時，訓練花費約為 557.6 萬美元。2025 年 1 月 20 日，DeepSeek 正式發布復雜推理類大模型 DeepSeek-R1，性能對齊 OpenAI o1 正式版。以 DeepSeek 系列大模型為代表的國產大模型性能已可比肩海外領軍大模型，且成本更低。

DeepSeek 系列大模型引發全球廣泛關注，海內外巨頭科技公司及云服務平臺廠商已相繼接入。2025 年 1 月 15 日，DeepSeek 推出 AI 助手 DeepSeek App。2025 年春節期間，DeepSeek 系列大模型火爆出圈，引發全球廣泛關注。根據新浪財經 2 月 1 日引用彭博社信息，DeepSeek 的 AI 助手在 140 個市場中成為下載量最多的移動應用。根據 Appfigures 的數據，DeepSeek 的推理人工智能聊天機器人在 1 月 26 日登上蘋果公司 App Store 的榜首，并自那時以來一直保持全球第一的位置。同時，全球也開始了對 DeepSeek 大模型的復刻。以港科大團隊為例，港科大助理教授何俊賢的團隊，只用了 8K 個樣本，就在 7B 模型上復刻出了 DeepSeek-R1-Zero 和 DeepSeek-R1 的訓練。當前，海內外巨頭科技公司及云服務平臺廠商已相繼接入了 DeepSeek 大模型，部分 AI 應用領域相關企業也已開始了 DeepSeek 大模型的部署和應用。DeepSeek 大模型獲得了全球的廣泛關注，認可度持續提升。我們認為，DeepSeek大模型的開源、低成本和高性能將大幅降低大模型的獲得、部署和應用成本，將加快大模型在 B 端和 C 端應用場景的落地。另外，DeepSeek 大模型的出圈將對全球大模型產業的競爭格局產生重要影響，將對海外領軍大模型廠商的領先性產生沖擊，并同時將對算力的未來發展產生重要影響。

DeepSeek 大模型的出圈預計不改算力整體需求向上的態勢，但推理和端側算力有望增長更快。DeepSeek 在算法效率和計算成本方面有著較大的優勢，短期內可能對訓練算力的增長有一定的平抑效應，但是不改 AI 算力整體需求長期上升的態勢。AI 作為全球智能化發展的主要抓手，大模型當前已應用于端側、教育、金融、辦公、傳媒、醫療、智能汽車、企業服務等多個應用場景，應用領域廣闊。DeepSeek 低成本而且開源的解決方案，大幅降低了 AI 在各行各業應用的技術和成本門檻，為 AI 的產業化落地提供了更快的路徑。推理和端側的算力需求增長潛力非常大。同時，較低訓練成本以及開源的 DeepSeek，有望帶來更低的大模型開發和使用門檻，基于該大模型開發的主體可能更多，也一定程度上為訓練算力需求提供了支撐。DeepSeek 并不是壓縮了算力市場，反而為算力市場增加了更多的想象空間。DeepSeek 也在積極與國產 AI 算力平臺合作。DeepSeek 大模型與國產 AI 芯片適配的逐步成熟，將加快推動國產 AI 芯片在國內大模型訓練端和推理端的應用，加快國產 AI 芯片產業鏈的成熟，為國產 AI 芯片產業帶來發展機遇，同時加快我國大模型產業的發展。

附件：DeepSeek 引發廣泛關注,大模型應用落地將加速,加快大模型在 B 端和 C 端應用場景的落地