作者 | 辰紋
來源 | 洞見新研社
今年年初,DeepSeek 橫空出世,讓世界重新認識了中國大模型。
幾乎在 DeepSeek 爆紅的同一時間,科大訊飛發布了全國產算力平臺上首個深度推理大模型——訊飛星火 X1,其獨一無二的標簽是 " 唯一基于全國產算力訓練的深度推理模型 "。
1 萬張華為昇騰 910B 國產算力卡,訓練出的星火 X1 在模型參數比業界同類小一個數量級的情況下,整體效果卻能對標 OpenAI o1 和 DeepSeek R1。
在曠日持久的科技賽跑中,科大訊飛用實際行動走出了一條自主可控,雖然艱辛,但更值得夸贊大模型發展路線。
01
技術突圍,國產算力的極限挑戰
從表面上看,科大訊飛選擇 " 全棧自主可控 " 路線是出于中美競爭的地緣環境,兩次被美國列入實體清單,無法獲得英偉達芯片算力的 " 另辟蹊徑 ",然而更深層次的內里,人工智能競爭的實質已經算法與模型的性能優劣,演變成算力 / 算法 / 應用這一整條鏈接綜合能力的考驗。
因而科大訊飛從一開始就確定了 " 全棧自主可控 " 的方向,算力國產化,算法自研。
2023 年 5 月,訊飛星火大模型發布,5 個月后,首個支撐萬億參數大模型訓練的萬卡國產算力平臺 " 飛星一號 " 也宣布正式啟用。
2024 年,在 " 飛星一號 " 算力平臺的支持下,訊飛星火大模型不斷升級,從 V3.5 到 V4.0 再到 V4.0 Turbo,核心能力全面對標 GPT-4 Turbo。
取得上述成績的背后是科大訊飛與華為共同攻克的技術無人區。自 2023 年 5 月起,雙方團隊在萬卡高速互聯組網、計算通信隱藏、訓練推理強交互等關鍵領域取得突破,將昇騰 910B 的訓練效率從最初相當于英偉達 A100 的 30%-50% 提升至 85%-95%。
今年 1 月,科大訊飛又發布了國內首個基于全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火 X1。
這個僅 130 億參數的 " 小模型 " 實力 " 驚人 ",在高考題、AIME 競賽題和高中奧賽題解答中,不僅答案準確,還能提供接近人類 " 慢思考 " 的詳細解題步驟。
3 個月后,科大訊飛與生態企業組成的聯合團隊通過多種優化手段提升 " 飛星一號 " 平臺上 MoE 模型集群推理的性能上限,并實現大規模專家并行集群推理性能翻番,訊飛星火 X1 也由此迎來了全新升級,在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務上效果顯著提升。
科大訊飛的實踐充分證明了基于國產算力訓練的全棧自主可控大模型具備登頂業界最高水平的實力和持續創新的潛力,與此同時,也在 " 自主可控 " 語境下,為中國的大模型行業提供了一條可供借鑒的破局之路。
02
應用為王,從教育醫療到央國企的全面滲透
研發實現了 " 全棧自主可控 ",其價值最終要體現在落地應用上,科大訊飛的戰略是以 "1+N" 的形式進行業務體系布局, "1" 是指通用底座大模型,"N" 是指以底座大模型賦能教育、醫療、汽車、辦公、工業、智能硬件等多個行業領域,并形成獨具優勢的行業大模型。
比如,訊飛星火 X1 在教育場景中落地時,聯合中國教育科學研究院發布基于 " 問題鏈 " 的高中數學智能教師助手,在全國百個試點區域部署,與上千名優秀教研員打造了上萬個優秀案例。
在實際教學中,老師們發現 X1 在一題多解、教學知識關聯、拓展學生高階思維等方面表現出色。相關技術的融入,科大訊飛 AI 學習機的學習推薦和診斷也變得更加精準,解題思路和知識鏈條更加清晰。
在醫療領域,X1 的模型策略已使專科輔助診斷和復雜病歷內涵質控準確率達 90%。科大訊飛還表示將在年內發布基于 X1 的醫療大模型升級版,確保其深層次診斷推理效果業界領先。
更令人矚目的是在央國企市場的攻城略地,科大訊飛為央企打造的專業大模型已成為行業標桿。
與中國石油共建的昆侖大模型使代碼開發效率提升 73%,行業知識問答采納率超 95%;為國家能源集團開發的智能評標助手獲國資委點名表揚;與中海油合作的 " 海能 " 人工智能模型已在招標采辦、員工健康等領域應用,并正在研發海上油田穩產增產等專業場景模型。
科大訊飛之所以能夠在 IDC 的報告中拿下去年央國企大模型解決方案市場份額第一,其核心原因在于滿足了產業應用 " 既要又要還要 " 的需求,即工程能力與技術能力雙向驅動。
在具體實踐中,科大訊飛通過 " 通專結合、端云聯動與軟硬一體 "(通用大模型與專業大模型結合、端側大模型與云端大模型聯動、軟硬件一體化)來實現部署成本與用戶體驗的平衡,提出 " 建算力、理數據、訓模型,到落場景、保安全、精運營 " 的全鏈路方法,從場景出發,給客戶提供人工智能的解決方案。
在工具層面上,科大訊飛進一步升級了模型定制優化工具鏈,支持監督微調、強化學習兩種模型定制優化方案,持續簡化定制步驟和成本。
03
星火燎原后的硬仗與新征途
從上文的分析不難看出,科大訊飛不僅證明了國產算力登頂技術巔峰的實力,更為中國大模型行業開辟了一條可借鑒的破局路徑。然而,大模型行業的競逐正步入深水區,訊飛面臨的考驗更為復雜。
其一,全球大模型正加速向多模態、強推理、高能效演進。昇騰 910B 效率雖追至 A100 的 85%-95%,但面對英偉達 H200 等新一代芯片及集群效率的持續躍升,保持算力底座競爭力仍需在芯片互聯、訓練框架、集群調度等 " 硬骨頭 " 上持續攻堅。
其二,大模型之爭終將演化為生態之爭,科大訊飛 "1+N" 戰略雖已鋪開,但相比互聯網巨頭在消費端的海量觸達和開發者生態號召力,其仍需在吸引廣大開發者、構建繁榮的工具鏈與社區生態上傾注更多資源與開放誠意,避免成為 " 孤勇者 "。
其三,行業落地已從 " 能用 " 邁向 " 好用且經濟 ",科大訊飛在央企、教育、醫療的標桿案例雖亮眼,但需將 " 通專結合、端云聯動 " 方法論沉淀為可快速復制的規模化能力,在確保 " 自主可控 " 前提下持續優化部署成本與用戶體驗,實現商業價值的可持續閉環。
今年 4 月份的業績說明會上,科大訊飛官方認為," 目前底座大模型還有很大的增長空間,通過預訓練和強化訓練兩種方法,大模型的自主進化在未來 2-3 年內還有巨大的提升空間,天花板非常高。"
科大訊飛董事長劉慶峰也表示,會繼續加大 "1+N" 的投入,搶抓通用人工智能的根紅利。" 在完全自主可控的基礎上,我們的通用底座大模型要做到第一梯隊,永爭行業第一,不僅僅是跟隨,并推動更多算法研發和創新。"
很明顯,科大訊飛的挑戰主要來源于持續不斷的創新與投入和長盈利周期的平衡,好就好在,科大訊飛以篳路藍縷的實踐點燃了希望之火,至少在當前這個時間節點,科大訊飛仍處于領跑的位置。
科大訊飛的未來如何,既取決于其在技術深水區持續攻堅的硬實力,也考驗其構建開放生態、實現規模落地的軟智慧。