Email:[email protected]
二,、重點產(chǎn)品
(五)語言大模型產(chǎn)品
揭榜任務:探索以知識為中心的大模型范式,,通過上下文編碼、動態(tài)記憶機制等核心技術(shù),,提升語言認知大模型的智慧涌現(xiàn)水平,。對標國際先進產(chǎn)品,提升中英雙語的語義理解,、邏輯推理,、代碼編程等能力,實現(xiàn)在線知識咨詢功能,,能夠?qū)崟r融合基于互聯(lián)網(wǎng)的海量信息,。開展大模型推理加速算法研究,提升語言大模型賦能智能產(chǎn)品的部署效率,。
預期目標:到2025年,,語言大模型在中英文均達到世界先進水平,提升大模型泛化能力,,零樣本或少樣本學習在超過30個基準中達到優(yōu)異性能,。中英雙語認知能力全面提升,,在模型常識性、專業(yè)性,、邏輯性,、推理能力方面取得重大突破。語言大模型在數(shù)字座艙,、機器人或語音助手等領(lǐng)域?qū)崿F(xiàn)應用,。
(六)語音大模型產(chǎn)品
揭榜任務:研究具有高通用性和高解釋性的通用語音表征理論和方法,突破語音數(shù)據(jù)依賴性強,、領(lǐng)域適應性弱等難題,,實現(xiàn)超大規(guī)模語音表征訓練、語音表征信息解耦合建模等關(guān)鍵技術(shù),,支撐語音大模型的泛化性,。構(gòu)建面向多個語種、多個語音任務共享的語音大模型,,賦能語音助手,、虛擬客服、數(shù)字人等智能產(chǎn)品的智能化升級,。
預期目標:到2025年,,語音大模型達到世界先進水平,覆蓋語種超20個,,其中漢語,、英語、法語等5個以上重點語種的處理效果業(yè)界領(lǐng)先,,可支撐語音識別,、語音合成、聲紋識別,、情感識別等10個以上語音任務,,性能較傳統(tǒng)模型實現(xiàn)顯著提升。
(七)視覺大模型產(chǎn)品
揭榜任務:研究視覺大模型統(tǒng)一算法底層架構(gòu),,創(chuàng)新視覺大模型訓練路徑,,構(gòu)建支持動態(tài)視覺理解和生成統(tǒng)一的底層基礎(chǔ)模型架構(gòu),,突破靜態(tài)向動態(tài)視覺大模型的范式升級,。視覺大模型能夠通過少樣本微調(diào)解決圖像、視頻等視覺任務,,生成式任務指標達到國際先進水平,,解決視覺大模型的高效設(shè)計、有效訓練,、快速推理等關(guān)鍵技術(shù)問題,。
預期目標:到2025年,,訓練超過千億級參數(shù)規(guī)模的通用視覺大模型,能夠通過少樣本微調(diào)方式解決超過30個視覺基礎(chǔ)任務(包括10個以上動態(tài)視覺或三維視覺任務)并且表現(xiàn)出色,,推理速度達到全球領(lǐng)先,,具備在智能終端產(chǎn)品的部署能力。
(八)多模態(tài)大模型產(chǎn)品
揭榜任務:研究多源多模態(tài)異構(gòu)數(shù)據(jù)的表示和對齊方法,,實現(xiàn)文本,、圖像、視頻,、語音等模態(tài)數(shù)據(jù)間的語義對齊,,全面提升多模態(tài)大模型性能。研究多模態(tài)大模型訓練和推理加速方法,,構(gòu)建算法,、框架、硬件和并行策略等協(xié)同考慮的優(yōu)化和計算架構(gòu),,提升萬億級參數(shù)多模態(tài)模型的工程效率,。
預期目標:到2025年,全面提升多模態(tài)大模型性能,,多模態(tài)大模型達到萬億參數(shù),,零樣本學習下解決15個以上多模態(tài)任務,基于主觀評價的最終效果和推理速度達到國際先進水平,。