久久久91-久久久91精品国产一区二区-久久久91精品国产一区二区三区-久久久999国产精品-久久久999久久久精品

ABB
關注中國自動化產業發展的先行者!
橫河電機25年9月
工業智能邊緣計算2025年會
2025工業安全大會
CAIAC 2025
OICT公益講堂
當前位置:首頁 >> 資訊 >> 行業資訊

資訊頻道

基于內生復雜性的類腦脈沖大模型“瞬悉1.0”問世
  • 點擊數:680     發布時間:2025-09-09 14:00:29
  • 分享到:
近日,中國科學院自動化研究所李國齊、徐波團隊在發表原創內生復雜性理論系列論文的工作基礎上,與沐曦MetaX合作,打造了類腦脈沖大模型“瞬悉1.0”(SpikingBrain-1.0),在國產千卡GPU算力平臺上完成全流程訓練和推理,實現了大模型在超長序列推理上數量級的效率和速度提升,展示了構建國產自主可控的新型非Transformer大模型架構生態的可行性。

近日,中國科學院自動化研究所李國齊、徐波團隊在發表原創內生復雜性理論系列論文的工作基礎上,與沐曦MetaX合作,打造了類腦脈沖大模型“瞬悉1.0”(SpikingBrain-1.0),在國產千卡GPU算力平臺上完成全流程訓練和推理,實現了大模型在超長序列推理上數量級的效率和速度提升,展示了構建國產自主可控的新型非Transformer大模型架構生態的可行性。研究團隊開源了SpikingBrain-1.0-7B模型并開放SpikingBrain-1.0-76B測試網址,同步公開了經工業界大規模驗證的類腦脈沖大模型SpikingBrain-1.0中英文技術報告。

當前,基于Transformer架構的大模型在Scaling law驅動下,通過增加網絡規模、算力資源和數據量提升模型智能水平,但模型的基本計算單元為簡單的點神經元模型,我們將此路徑稱為“基于外生復雜性”的通用智能實現方法。Transformer架構的固有缺點訓練時開銷隨序列長度呈平方級增長以及推理時顯存占用也隨序列長度線性增加,構成了資源消耗的主要瓶頸,導致其處理超長序列的能力受限。

研發團隊借鑒大腦神經元內部復雜工作機制提出“基于內生復雜性”的大模型構架方式,打造類腦脈沖大模型“瞬悉1.0”( SpikingBrain-1.0),在理論上建立了脈沖神經元內生動力學與線性注意力模型之間的聯系,揭示了現有線性注意力機制是樹突計算的特殊簡化形式,從而清晰地展示了一條不斷提升模型復雜度和性能的新型可行路徑。研發團隊進而構建并開源了基于脈沖神經元、具有線性(SpikingBrain-1.0-7B)及混合線性復雜度(SpikingBrain-1.0-76B,激活參數量12B)的新型類腦基礎模型,開發了面向國產GPU(沐曦MetaX曦云C550)集群高效訓練和推理框架、Triton 算子庫、模型并行策略以及集群通信原語。

SpikingBrain-1.0在多個核心性能上實現突破。第一,極低數據量上的高效訓練:訓練階段具有線性或近線性復雜度,顯著提升長序列訓練效率,并能依托高效轉換訓練范式,以約為主流大模型2%的預訓練數據量實現與眾多開源Transformer模型在多任務語言理解(MMLU) ,中文多任務語言理解(CMMLU、Ceval),常識推理能力(ARC、HS)任務上相媲美的性能。第二,推理效率的數量級提升:推理階段結合脈沖神經元事件驅動特性,SpikingBrain具有常數或部分層常數級別的復雜度和存儲開銷,SpikingBrain-7B模型在100萬Token長度下TTFT(生成第一個Token所需時間)相比Transformer架構加速達到26.5倍,400萬Token長度下加速超過100倍。同時在手機CPU端64k-128k-256k長度下較Llama3.2的同規模模型Decoding速度提升4.04x-7.52x-15.39x,在超長序列處理能力上展現出數量級的效率和速度提升。第三,國產自主可控類腦大模型生態的構建:SpikingBrain適配了面向國產GPU集群的高效訓練和推理框架、Triton算子庫、模型并行策略以及集群通信原語,表明了構建國產自主可控的新型非Transformer大模型架構生態的可行性。第四,基于動態閾值脈沖化的多尺度稀疏機制:設計細粒度的兩階段動態閾值脈沖化策略,結合粗粒度的混合專家模型(MoE)方案,在7B模型上實現了超過69.15%的稀疏度,長序脈沖占比約1.85%,為低功耗的類腦大模型運行提供有力支撐。

這是我國首次提出大規模類腦線性基礎模型架構、并首次在國產GPU算力集群上構建類腦脈沖大模型的訓練和推理框架。提出的模型解決了脈沖驅動限制下的大規模類腦模型性能退化問題,其超長序列處理能力在法律/醫學文檔分析、復雜多智能體模擬、高能粒子物理實驗、DNA序列分析、分子動力學軌跡等超長序列任務建模場景中具有顯著的潛在效率優勢。本次發布的大模型為新一代人工智能發展提供了非Transformer架構的新技術路線,并將啟迪更低功耗的下一代神經形態計算理論和芯片設計。

詳細內容請參見技術報告。


相關鏈接:

1)網絡端的試用端口

2)中文技術報告

3)英文技術報告

4)模型代碼


來源:中國科學院自動化研究所

熱點新聞

推薦產品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 91精品乱码一区二区三区| 日韩欧美成人乱码一在线| 免费高清特级毛片| 日本大学生免费一级一片| 风间中文字幕亚洲一区中文馆| 性欧美一级毛片| 97理论三级九七午夜在线观看| 欧乱色国产精品兔费视频| 1769国内精品观看视频| 亚洲国产精品日韩一线满| 中国国产一国产一级毛片视频| 国产剧情一区二区| 国产欧美日韩亚洲精品区2345 | 美女国产精品福利视频| 美女被免费网站在线视频九色| 久久免费成人| 免费高清黄色| 国内精品福利爱丝视频_速发| 成人永久福利在线观看不卡| 亚洲国产成人久久综合碰| a一级爱做片免费| 亚洲青青青网伊人精品| 国产成人精品视频一区二区不卡| 国产精品亚洲午夜不卡| 亚洲大尺度在线| 久久草在线观看视频| 成年网站在线观看视频| 国产精品成人亚洲| 成人国产激情福利久久精品| 国产亚洲欧美在线视频| 亚洲高清不卡| 亚洲欧美日本国产综合在线| 日本二区免费一片黄2019| 免费一级毛片在线播放欧美| 国产逼| 国产国产人在线成免费视频69| 香蕉97超级碰碰碰碰碰久| 一本久道久久综合| 手机免费黄色网址| 亚洲伦理精品久久| 亚洲区一二三四区2021|