一、方案簡(jiǎn)介
某司以軍工及政務(wù)特種領(lǐng)域的大模型私有化落地為核心方向,打磨覆蓋數(shù)據(jù)治理,微調(diào)數(shù)據(jù)生成,知識(shí)庫(kù)構(gòu)建,領(lǐng)域大模型訓(xùn)練、編排、應(yīng)用全周期的大模型開發(fā)產(chǎn)品集,提供軍事智能問(wèn)答、軍事情報(bào)分析、智能空戰(zhàn)助手、指揮輔助決策及自動(dòng)化調(diào)度等解決方案及應(yīng)用產(chǎn)品。
二、技術(shù)能力
(一)數(shù)據(jù)治理
支持標(biāo)準(zhǔn)化的數(shù)據(jù)治理流程,為大模型訓(xùn)練及領(lǐng)域知識(shí)庫(kù)提供數(shù)據(jù)基礎(chǔ)。
(二)大模型微調(diào)
支持多種大模型基座、微調(diào)算法及優(yōu)化訓(xùn)練,輕松、高效評(píng)測(cè)領(lǐng)域大模型效果。
(三)數(shù)據(jù)生成
支持適應(yīng)特定任務(wù)的微調(diào)數(shù)據(jù)生成策略為大模型微調(diào)提供海量高質(zhì)量問(wèn)答對(duì)語(yǔ)料數(shù)據(jù)。
(四)大模型編排
支持拖拉拽交互方式、智能提示詞工程意圖識(shí)別分流調(diào)用、思維鏈構(gòu)建等業(yè)務(wù)相關(guān)編排集成,快速搭建RAG及Agent應(yīng)用。
(五)知識(shí)庫(kù)構(gòu)建
支持領(lǐng)域知識(shí)圖譜構(gòu)建及知識(shí)向量化為大模型提供高效、可信的知識(shí)增強(qiáng)能力。
(六)大模型應(yīng)用
支持可信智能問(wèn)答、多源情報(bào)自監(jiān)督學(xué)習(xí)、外部系統(tǒng)API精準(zhǔn)調(diào)用、作戰(zhàn)計(jì)劃推理生成等可信、可控、安全、白盒的軍事領(lǐng)域大模型應(yīng)用。
三、方案拓?fù)鋱D

四、核心子系統(tǒng)
(一)大模型數(shù)據(jù)治理平臺(tái)
用于單位海量知識(shí)數(shù)據(jù)管理,為大模型增量化訓(xùn)練及微調(diào)訓(xùn)練提供基礎(chǔ)輸出處理支撐。
1.多源異構(gòu)文檔一鍵解析處理
支持海量多源異構(gòu)數(shù)據(jù)集一鍵上傳解析單個(gè)數(shù)據(jù)集支持上千量級(jí)文檔解析處理。
2.逐詞句精準(zhǔn)檢索定位
內(nèi)置AI模型,支持OCR文字、圖片、表格等精準(zhǔn)識(shí)別支持文檔內(nèi)逐詞句的精準(zhǔn)檢索、定位及調(diào)用具備簡(jiǎn)便高效的人工審核功能。
3.高度互操作的系統(tǒng)框架
提供高度可擴(kuò)展的接口,確保靈活的系統(tǒng)集成能力 支持多種數(shù)據(jù)源及文件格式,實(shí)現(xiàn)無(wú)縫數(shù)據(jù)交互。
4.多元高精度OCR識(shí)別
支持從PDF、模糊掃描件和圖片中精準(zhǔn)提取文字、表格、圖像,并有效排除水印和印章等干擾信息。
5.原文結(jié)構(gòu)高效解析審核
支持自動(dòng)解析原文結(jié)構(gòu)及內(nèi)容,實(shí)現(xiàn)高效的內(nèi)容定位與審核。

(二)大模型微調(diào)訓(xùn)練管理應(yīng)用平臺(tái)
平臺(tái)可基于單位歷史數(shù)據(jù)、知識(shí)庫(kù)等私有領(lǐng)域資料推理生成微調(diào)訓(xùn)練數(shù)據(jù)集,效果質(zhì)量媲美業(yè)務(wù)人員編寫,并具有領(lǐng)域?qū)佟?nèi)容準(zhǔn)確、溯源可查的優(yōu)勢(shì)。
平臺(tái)定義了面向大模型時(shí)代的微調(diào)訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范,提供基座模型微調(diào)訓(xùn)練、應(yīng)用部署服務(wù)。
1.領(lǐng)域訓(xùn)練數(shù)據(jù)集一鍵生成
基于企業(yè)歷史數(shù)據(jù)、知識(shí)庫(kù)等私有領(lǐng)域資料推理生成的微調(diào)訓(xùn)練數(shù)據(jù)集,效果質(zhì)量媲美業(yè)務(wù)人員編寫,并具有領(lǐng)域?qū)佟?nèi)容準(zhǔn)確、溯源可查的優(yōu)勢(shì)。
2.以審代標(biāo)成本可控效率高
提供高效智能的數(shù)據(jù)審核方法及工具鏈,以審核代替人工編寫,大幅解決人員、時(shí)間成本問(wèn)題,降低數(shù)據(jù)配置和處理門檻,提升組織效能。
3.一站搞定基座大模型微調(diào)
整合基座大模型庫(kù)、標(biāo)準(zhǔn)化數(shù)據(jù)推理生成和模型微調(diào)訓(xùn)練流程,一站式完成用戶微調(diào)大模型需求,提供模型云部署、云應(yīng)用服務(wù)。
4.自研問(wèn)答數(shù)據(jù)生成大模型
一鍵生成海量高質(zhì)量問(wèn)答數(shù)據(jù),軍事領(lǐng)域問(wèn)答數(shù)據(jù)生成效果超越ChatGPT 3.5。
5.自研問(wèn)答數(shù)據(jù)質(zhì)量評(píng)估模型
構(gòu)建基于關(guān)鍵維度的QA數(shù)據(jù)評(píng)估體系,支持模型自動(dòng)化評(píng)估,顯著提升審核效率。
6.訓(xùn)練效果可視化評(píng)估對(duì)比
支持生成模型可視化評(píng)估報(bào)告,支持多模型性能對(duì)比,幫助選擇最優(yōu)模型。

(三)基于大模型增強(qiáng)的知識(shí)圖譜平臺(tái)
平臺(tái)依托于大模型技術(shù),解決現(xiàn)有知識(shí)圖譜構(gòu)建難、知識(shí)不完整的問(wèn)題,通過(guò)自動(dòng)化生成圖式、零樣本抽取知識(shí)及智能化補(bǔ)全知識(shí),極大簡(jiǎn)化知識(shí)圖譜構(gòu)建流程,提升圖譜的全面性、準(zhǔn)確性和泛化性;解決大模型事實(shí)幻覺(jué)、推理可解釋性低的問(wèn)題,確保回答準(zhǔn)確率;基于知識(shí)圖譜結(jié)構(gòu)化的業(yè)務(wù)邏輯與規(guī)則,通過(guò)可信推理來(lái)輔助決策。
1.自動(dòng)生成圖譜本體結(jié)構(gòu)
基于大模型自動(dòng)生成本體結(jié)構(gòu)(Schema),降低圖譜構(gòu)建的業(yè)務(wù)門檻。利用大模型挖掘潛在實(shí)體與關(guān)系,補(bǔ)全完善圖譜本體結(jié)構(gòu)(Schema)。采用可視化拖拉拽的交互方式,提供極致的用戶體驗(yàn)。
2.知識(shí)圖譜可信推理
支持原因溯源,幫助理解復(fù)雜事件起因推導(dǎo)實(shí)體潛在結(jié)果,預(yù)見可能發(fā)展方向,助力戰(zhàn)略制定和風(fēng)險(xiǎn)管理直觀揭示實(shí)體之間的復(fù)雜聯(lián)系,幫助識(shí)別關(guān)鍵關(guān)聯(lián)和潛在影響。
3.知識(shí)圖譜精準(zhǔn)問(wèn)答
支持知識(shí)糾錯(cuò)與溯源、驗(yàn)證結(jié)果、提升答案的可解釋性。填補(bǔ)大模型領(lǐng)域知識(shí)空白,提供更全面的答案。推薦關(guān)聯(lián)實(shí)體,幫助用戶深入全面獲取相關(guān)信息。

(四)大模型應(yīng)用編排平臺(tái)
平臺(tái)面向定制化業(yè)務(wù)場(chǎng)景,可通過(guò)自由配置、組合組件,高效搭建、測(cè)試、優(yōu)化大模型RAG及Agent應(yīng)用,滿足各類軍工業(yè)務(wù)場(chǎng)景的應(yīng)用需求。
1.智能提示詞工程
提供典型結(jié)構(gòu)化提示詞設(shè)計(jì)架構(gòu);提供典型提示詞要素模板;新手快速構(gòu)建優(yōu)質(zhì)提示詞。
2.意圖識(shí)別分流Agent調(diào)用
意圖分流模塊組件,支持用戶意圖精準(zhǔn)分流;指令槽位解析組件,準(zhǔn)確生成API調(diào)用指令;支持多類型大模型應(yīng)用部件調(diào)用,大幅提升大模型應(yīng)用可拓展性。
3.高效思維鏈推理組件生成
預(yù)置高頻思維鏈構(gòu)建應(yīng)用模板;業(yè)務(wù)人員快速搭建思維鏈復(fù)雜大模型智能應(yīng)用;可視化Flow節(jié)點(diǎn)編排業(yè)務(wù)流程,極簡(jiǎn)交互方式。
4.跟蹤預(yù)覽應(yīng)用性能調(diào)試
可視化跟蹤和檢查輸入輸出,支持自動(dòng)化調(diào)試延遲,Tokens及其他性能指標(biāo),快速定位并解決編排問(wèn)題;支持窗口預(yù)覽應(yīng)用響應(yīng),助力高效調(diào)試應(yīng)用效果。

五、核心硬件——國(guó)產(chǎn)化一體機(jī)
(一)產(chǎn)品概述
該產(chǎn)品是基于國(guó)產(chǎn)GPU、CPU及國(guó)產(chǎn)操作系統(tǒng)的AI一體機(jī),可集成行至自研大模型產(chǎn)品應(yīng)用,為軍工用戶提供高性能、安全可靠的AI解決方案,實(shí)現(xiàn)快速部署與高效應(yīng)用。
(二)使用模式
1.集群端
單臺(tái)設(shè)備最大支持千億量級(jí)訓(xùn)練數(shù)據(jù)準(zhǔn)備、及大模型微調(diào)訓(xùn)練。推理支持百級(jí)用戶并發(fā),可覆蓋千級(jí)以上用戶應(yīng)用場(chǎng)景。適用于集群端,如機(jī)房、數(shù)據(jù)中心等專業(yè)化環(huán)境。
2.邊緣端
單臺(tái)設(shè)備最大支持百億級(jí)大模型推理應(yīng)用,支持超20個(gè)用戶并發(fā),可覆蓋百人規(guī)模用戶應(yīng)用場(chǎng)景。適用于邊緣端,如車載、機(jī)載等場(chǎng)景。
(三)產(chǎn)品特點(diǎn)
1.全國(guó)產(chǎn)芯片:搭載國(guó)產(chǎn)化GPU、CPU、ARM架構(gòu),提供卓越性能,徹底擺脫外部依賴。
2.自主操作系統(tǒng):基于國(guó)產(chǎn)操作系統(tǒng),確保數(shù)據(jù)安全與兼容性,實(shí)現(xiàn)自主可控。
3.內(nèi)置大模型應(yīng)用:內(nèi)置成熟大模型軟件產(chǎn)品,無(wú)需額外開發(fā)直接上手,實(shí)現(xiàn)快速部署與高效應(yīng)用。
4.穩(wěn)定可靠:通過(guò)嚴(yán)苛測(cè)試,具備多卡推理能力,支持快速上線,確保高穩(wěn)定性與強(qiáng)大性能。
5.靈活適配:靈活適配多種基座大模型,包括但不限于ChatGLM、Qwen、BaiChuan等。
六、應(yīng)用場(chǎng)景
(一)知識(shí)檢索工程
試驗(yàn)鑒定大模型通過(guò)文檔管理、文檔識(shí)別、文檔章節(jié)分類、文檔信息提取、數(shù)據(jù)治理等全流程工作,構(gòu)建試驗(yàn)鑒定數(shù)據(jù)的知識(shí)檢索應(yīng)用,支持用戶進(jìn)行智能問(wèn)答、展示型號(hào)百科和型號(hào)履歷卡等。基于全周期的數(shù)據(jù)提取、治理、應(yīng)用過(guò)程,幫助軍事人員高效掌握裝備和兵種信息。
(二)可信知識(shí)問(wèn)答應(yīng)
系統(tǒng)首先需要對(duì)語(yǔ)料庫(kù)進(jìn)行收集同時(shí)結(jié)合專業(yè)知識(shí)設(shè)置提示詞,而后通過(guò)檢索增強(qiáng)技術(shù)完成智能問(wèn)答并支持知識(shí)溯源;結(jié)合任務(wù)場(chǎng)景和相關(guān)知識(shí)微調(diào)大模型,最終提供領(lǐng)域“專用”的問(wèn)答能力。
(三)智能參謀助手
系統(tǒng)通過(guò)深入分析和融合歷史數(shù)據(jù)、實(shí)時(shí)態(tài)勢(shì)和業(yè)務(wù)系統(tǒng)信息,面向作戰(zhàn)場(chǎng)景實(shí)現(xiàn)情報(bào)分析、計(jì)劃推薦,涵蓋單任務(wù)執(zhí)行到復(fù)雜的工作流程自動(dòng)化,為決策者提供全面而精確的輔助決策建議。
(四)作戰(zhàn)方案生成
基于大模型的NLP任務(wù)統(tǒng)一、數(shù)據(jù)格式統(tǒng)一、任務(wù)模式統(tǒng)一的巨大優(yōu)勢(shì),將其替代或輔助傳統(tǒng)人力環(huán)節(jié),大幅提高方案生成效率,實(shí)現(xiàn)自動(dòng)化的作戰(zhàn)行動(dòng)方案生成。
(五)殺傷鏈生成
在殺傷鏈應(yīng)用中設(shè)計(jì)基于大模型的智能體框架,通過(guò)任務(wù)規(guī)劃智能體實(shí)現(xiàn)針對(duì)當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)的殺傷鏈構(gòu)建規(guī)劃,通過(guò)任務(wù)執(zhí)行智能體執(zhí)行當(dāng)前殺傷鏈及其評(píng)估,同時(shí)面向態(tài)勢(shì)變化場(chǎng)景進(jìn)行實(shí)時(shí)更迭實(shí)現(xiàn)殺傷鏈的動(dòng)態(tài)重構(gòu)。