“本源悟空”全球首次運(yùn)行十億參數(shù)級AI大模型微調(diào)任務(wù)
中新社合肥4月7日電 (記者 張俊)記者7日從安徽省量子計算工程研究中心獲悉,中國第三代自主超導(dǎo)量子計算機(jī)“本源悟空”近日完成全球首次運(yùn)行十億參數(shù)級AI大模型微調(diào)任務(wù)。
本次任務(wù)由本源量子計算科技(合肥)股份有限公司(簡稱“本源量子”)、合肥綜合性國家科學(xué)中心人工智能研究院等聯(lián)合攻關(guān)完成的。實(shí)驗(yàn)結(jié)果顯示,在參數(shù)量減少76%的前提下,AI大模型訓(xùn)練效果反而提升8.4%。這一成果不僅驗(yàn)證了量子計算助力實(shí)現(xiàn)大模型輕量化的可行性,更為破解大模型“算力焦慮”開辟了新路徑。
大模型微調(diào)是指在通用大模型的基礎(chǔ)上,通過進(jìn)一步訓(xùn)練特定領(lǐng)域數(shù)據(jù),使其適應(yīng)醫(yī)療診斷、金融風(fēng)控等專業(yè)場景。傳統(tǒng)低秩微調(diào)面臨性能瓶頸、泛化能力有限等問題,量子計算憑借其疊加態(tài)和糾纏態(tài)特性可同時探索海量參數(shù)組合,提升大模型微調(diào)的效率。
本源量子副總裁竇猛漢介紹,團(tuán)隊創(chuàng)新設(shè)計了一種量子加權(quán)張量混合參數(shù)微調(diào)的方法,將模型權(quán)重轉(zhuǎn)化為量子神經(jīng)網(wǎng)絡(luò)與張量網(wǎng)絡(luò)混合架構(gòu),前者通過量子門操作提取高維非線性特征,張量網(wǎng)絡(luò)則壓縮參數(shù)規(guī)模。
在“本源悟空”的量子芯片上,AI大模型單批次數(shù)據(jù)可生成數(shù)百個量子任務(wù)并行處理。實(shí)驗(yàn)數(shù)據(jù)顯示,優(yōu)化后的模型在心理咨詢對話數(shù)據(jù)集上訓(xùn)練損失降低15%,數(shù)學(xué)推理任務(wù)的嚴(yán)格準(zhǔn)確率從68%提升至82%。合肥綜合性國家科學(xué)中心人工智能研究院副研究員陳昭昀表示,這是量子計算首次“真機(jī)實(shí)戰(zhàn)”AI大模型任務(wù),證明現(xiàn)有硬件已能初步支撐大模型微調(diào)。
截至目前,“本源悟空”超導(dǎo)量子計算機(jī)全球訪問已覆蓋139個國家和地區(qū),完成35萬個量子運(yùn)算任務(wù),涵蓋流體動力學(xué)、金融、生物醫(yī)藥等多個行業(yè)領(lǐng)域。(完)

國內(nèi)新聞精選:
- 2025年04月07日 14:34:02
- 2025年04月07日 13:31:18
- 2025年04月07日 12:55:15
- 2025年04月07日 10:05:57
- 2025年04月06日 22:38:15
- 2025年04月06日 16:59:56
- 2025年04月06日 10:01:34
- 2025年04月05日 17:20:05
- 2025年04月05日 17:02:22
- 2025年04月05日 12:28:04