DeepSeek新架構“MODEL1”代碼曝光，最快2月發(fā)布

2026-01-21 來源：電子工程專輯

566

近日， DeepSeek在GitHub上的代碼庫更新中，意外曝光了名為“MODEL1”的全新模型架構標識，這被廣泛認為是其下一代旗艦模型DeepSeek V4的技術基礎。多方信息顯示，該模型最快有望于2026年2月中旬，即農歷新年期間正式發(fā)布。

代碼泄露玄機，架構徹底重構

此次曝光源于DeepSeek對其開源推理加速庫FlashMLA的更新。在橫跨114個文件的代碼變動中，出現了28處“MODEL1”標識符，其技術路徑與現有的V32（即DeepSeek-V3.2）架構存在顯著差異，暗示這是一個經過徹底重構的新設計。

根據泄露的代碼信息，新架構的核心革新聚焦于底層性能優(yōu)化。具體調整涉及鍵值（KV）緩存布局、稀疏性處理方式以及對FP8數據格式解碼的支持等關鍵技術環(huán)節(jié)。這些改進旨在針對性解決大模型運行中高內存占用與計算效率的瓶頸，為模型在同等硬件資源下實現更強的性能奠定基礎。

關于新模型的發(fā)布時間，市場傳聞與此次代碼更新相互印證。本月初，外媒The Information爆料稱，DeepSeek計劃在2月中旬農歷新年期間推出新一代旗艦AI模型——DeepSeek V4。隨后，國內多家媒體也引述知情人士消息確認了這一發(fā)布窗口。

有報道稱，內部初步測試表明，DeepSeek V4在代碼生成與理解能力上已超過市場上的其他頂級模型。此前，DeepSeek于2025年1月發(fā)布的推理模型R1已在數學和代碼推理上樹立了標桿，而V4有望在此基礎上實現新的躍升。

DeepSeek此番動向引發(fā)了國內外科技社區(qū)的密切關注。

如果DeepSeek V4能如期發(fā)布并兌現其性能承諾，這可能標志著國產大模型首次在編程等核心能力上實現對國際頭部模型的全面超越。有海外博主評論稱：“如果我們能再迎來像DeepSeek那樣的突破性時刻，那將是具有里程碑意義的。”

此外，新架構的優(yōu)化也順應了行業(yè)降低推理成本的大趨勢。英偉達此前已通過其Blackwell架構與TensorRT-LLM的協同優(yōu)化，將DeepSeek-R1的單Token推理成本大幅降低。DeepSeek自身在模型架構效率上的革新，將進一步推動大語言模型的應用普及。

目前，深度求索公司尚未對“MODEL1”代碼曝光及新模型的發(fā)布傳聞作出任何官方回應。業(yè)界正屏息以待，看DeepSeek是否會在2026年新春為世界帶來又一次驚喜。

行業(yè)動態(tài)

AMD參與投資，美國光芯片公司Ayar Labs完成5億美元E輪融資

【IPO一線】牛芯半導體正式啟動上市輔導深耕半導體領域打造核心競爭力

盛路通信：低空經濟天線量產交付，通感一體化研究處于技術驗證階段

熱讀文章

苗圩出席統籌推進疫情防控和產業(yè)轉型升級促進制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會

一圖讀懂2020年《政府工作報告》

工業(yè)富聯：擬7763萬美元收購鴻海精密美國子公司相關資產