隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學(xué)院自動化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國科學(xué)院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務(wù)時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學(xué)院自動化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國科學(xué)院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務(wù)時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
本文鏈接:http://www.enbeike.cn/news-2-2413-0.html我國科學(xué)家提出高效推理策略 可避免大模型“過度思考”
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇:面對AI“抗命”,人類該怎么辦
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“
”按鈕