亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態(tài)思考新時代

3個月前 來源:財經(jīng)網(wǎng) 觀看:28

3月18日,昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,即日起開源模型權(quán)重和技術(shù)報告。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

13gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

開啟多模態(tài)思考新時代3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

繼OpenAI o1和DeepSeek-R1在全球掀起長思考模型熱潮后,大模型進入新技術(shù)范式。昆侖萬維秉持實現(xiàn) AGI 的初心,積極貢獻開源社區(qū),正式開源Skywork R1V多模態(tài)視覺推理模型,成為中國第一個開源「多模態(tài)推理模型」的企業(yè)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

什么是視覺推理模型?3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

視覺推理模型是一類能夠解決需要思維鏈(Chain-of-Thought)的視覺任務(wù)的模型,通過對視覺信息進行多步邏輯推理與分析,逐步推導(dǎo)出最終結(jié)果。這種模型不僅關(guān)注圖像內(nèi)容的識別與理解,更強調(diào)通過層層遞進的推理路徑,實現(xiàn)復(fù)雜視覺問題的精準(zhǔn)求解,例如視覺邏輯推理、視覺數(shù)學(xué)問題、圖像中的科學(xué)現(xiàn)象分析、醫(yī)學(xué)影像的診斷推理等,從而有效拓展了視覺大模型的應(yīng)用邊界。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

無論是日常繁瑣的工作任務(wù)、復(fù)雜的數(shù)據(jù)分析、難以解答的學(xué)術(shù)問題,還是前所未見的陌生場景,都可以交給Skywork R1V進行高效處理。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

快速體驗下來,R1V的視覺理解和推理能力雙雙在線。這樣的模型能力是如何煉成的呢?3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

強大推理能力,刷新跨模態(tài)任務(wù)新高度3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在Reasoning推理能力方面,Skywork R1V實現(xiàn)了模型的頂尖邏輯推理與數(shù)學(xué)分析能力。在權(quán)威的MATH500和AIME基準(zhǔn)測試中,Skywork R1V分別取得了94.0和72.0的高分,明顯領(lǐng)先于行業(yè)內(nèi)眾多主流模型。Skywork R1V在純文本復(fù)雜推理任務(wù)中展現(xiàn)出卓越性能,使其在邏輯推理和數(shù)學(xué)問題求解領(lǐng)域展現(xiàn)出人類專家級別的水準(zhǔn)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在Vision視覺理解能力方面,Skywork R1V成功地將其強大的文本推理與思維鏈推導(dǎo)能力高效遷移到視覺任務(wù)中。憑借創(chuàng)新的跨模態(tài)遷移技術(shù)與推理優(yōu)化框架,Skywork R1V能夠高效解決需要多步視覺推理的問題,在MMMU與MathVista等視覺推理基準(zhǔn)中分別取得了69和67.5的優(yōu)異成績。這些結(jié)果不僅明顯超越了多個近似大小的開源競爭模型,更達到與規(guī)模更大的閉源模型媲美的水準(zhǔn),充分證實了Skywork R1V在需要視覺思維鏈推理的跨模態(tài)任務(wù)中的領(lǐng)先優(yōu)勢。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

Skywork R1V通過視覺與文本能力的深度融合和視覺思維鏈推理能力的突破,推動了多模態(tài)推理模型的進一步發(fā)展,標(biāo)志著人工智能領(lǐng)域的又一重大進步。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

目前,Skywork R1V已全面開源,期望助力全球范圍內(nèi)更多視覺推理任務(wù)的學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用探索。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

和開源同規(guī)模或更大規(guī)模模型的對比,Skywork R1V 38B體現(xiàn)出行業(yè)顯著優(yōu)異的推理能力,以及領(lǐng)先的多模態(tài)視覺理解能力。如下圖,與開源同規(guī)?;蚋笠?guī)模模型的對比:3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

23gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

與閉源頭部模型性能對比,R1V 38B模型性能媲美甚至超越更大開源模型以及主流閉源模型。如下圖,與開源大尺寸模型與閉源專有模型的對比:3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

33gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

三大核心技術(shù)創(chuàng)新,引領(lǐng)視覺推理新突破3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

Skywork R1V能夠達到當(dāng)前的性能高度,依賴于以下三項關(guān)鍵技術(shù)創(chuàng)新:3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

1、文本推理能力的多模態(tài)高效遷移3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

昆侖萬維團隊首次提出利用Skywork-VL的視覺投影器,無需重新訓(xùn)練語言模型和視覺編碼器,即可實現(xiàn)文本推理能力的高效遷移到視覺任務(wù),同時保留了優(yōu)秀的原本推理文本能力(AIME 72.0,MATH500 94.0)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

2、多模態(tài)混合式訓(xùn)練(IterativeSFT+GRPO)3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

通過結(jié)合迭代監(jiān)督微調(diào)(Iterative SFT)和GRPO強化學(xué)習(xí),分階段對齊視覺-文本表征,實現(xiàn)跨模態(tài)任務(wù)的高效融合,極大提升跨模態(tài)任務(wù)的表現(xiàn)。推動模型在MMMU基準(zhǔn)達到69分的能力,同時在MathVista達到67.5分,與更大規(guī)模的閉源模型基本持平。通過反復(fù)迭代地利用高質(zhì)量數(shù)據(jù)與高難度數(shù)據(jù)的組合,實現(xiàn)模型持續(xù)的知識鞏固與錯誤糾正,顯著提升了多模態(tài)推理的精度與泛化性能。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

圖丨多模態(tài)混合式訓(xùn)練(來源:Skywork R1V技術(shù)報告)3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

圖丨多模態(tài)混合式訓(xùn)練(來源:Skywork R1V技術(shù)報告)3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

3、自適應(yīng)長度思維鏈蒸餾3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

團隊提出了一種基于視覺-文本復(fù)雜度的自適應(yīng)推理鏈長度控制機制,動態(tài)優(yōu)化模型推理過程,避免模型“過度思考”,提升推理效率。結(jié)合多階段自蒸餾策略,進一步提升了數(shù)據(jù)生成與推理過程的質(zhì)量,促進了模型在復(fù)雜多模態(tài)任務(wù)中的表現(xiàn)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

圖丨自適應(yīng)長度思維鏈蒸餾(來源:Skywork R1V技術(shù)報告)3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

圖丨自適應(yīng)長度思維鏈蒸餾(來源:Skywork R1V技術(shù)報告)3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

Skywork R1V在訓(xùn)練過程中創(chuàng)新性地采用了三階段方法,使得文本端強大的推理能力得以高效遷移至視覺任務(wù)上,具體訓(xùn)練流程如下:3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

1、STEP1 視覺語言表征的初始對齊3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

訓(xùn)練時首先使用輕量級的視覺適配器(MLP)連接視覺編碼器(ViT)與語言模型,在已有的200萬條常規(guī)多模態(tài)數(shù)據(jù)上進行訓(xùn)練,使得MLP初步學(xué)習(xí)如何將圖像特征映射至語言空間。這一階段僅訓(xùn)練MLP適配器,視覺編碼器和語言模型參數(shù)保持凍結(jié)不變,快速、高效地實現(xiàn)視覺與語言表征的初步對齊。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

2、STEP2 推理能力遷移3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

利用第一階段訓(xùn)練好的MLP適配器,直接將視覺編碼器與原始的強推理語言模型(R1-distilled-Qwen-32B)連接,形成Skywork-R1V視覺推理模型。雖然此時語言模型的參數(shù)發(fā)生了改變,但得益于語言模型架構(gòu)的高度相似性和MLP的泛化能力,重新組裝后的模型已能表現(xiàn)出一定的視覺推理能力,初始性能即達到業(yè)內(nèi)同等規(guī)模的先進水平。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

3、STEP3 視覺與文本模態(tài)精準(zhǔn)對齊3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

最后,采用創(chuàng)新的“混合優(yōu)化框架”,進一步精準(zhǔn)對齊視覺和語言模態(tài)的表征。這一階段分為兩大步驟:迭代監(jiān)督微調(diào)(Iterative SFT)和群組相對策略優(yōu)化(GRPO)強化學(xué)習(xí)。在整個訓(xùn)練過程中,Skywork-R1V還創(chuàng)新性地引入了“自適應(yīng)長度思維鏈蒸餾技術(shù)”,動態(tài)優(yōu)化推理鏈長度,防止模型過度思考,從而提升了推理效率和質(zhì)量。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

通過以上的訓(xùn)練策略,Skywork R1V在視覺推理任務(wù)上取得突破性進展,并在多個公開評測基準(zhǔn)中達到或超過了現(xiàn)有領(lǐng)先模型的性能。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

此外,Skywork團隊多模態(tài)理解模型也在進行"全面貫通"的進化,將視覺多模態(tài)擴展為全模態(tài)模型,引入語音理解能力。當(dāng)前,全模態(tài)模型往往受限于特定領(lǐng)域不僅需要獨立訓(xùn)練多個專業(yè)模型,更面臨跨模態(tài)協(xié)同的算力挑戰(zhàn)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

基于R1V模型,Skywork團隊設(shè)計了一種靈活在R1V中擴展語音理解模態(tài)的方式,從而實現(xiàn)一個全模態(tài)思考大模型,該在單個模型中同時實現(xiàn)圖像、視頻、語音的全模態(tài)理解能力,并在語音和視覺理解評測中斬獲多項SOTA成績。我們將陸續(xù)公布測評成績、開源全模態(tài)思考大模型。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

持續(xù)開源回饋社區(qū),堅定邁向AGI3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

2023年10月以來,昆侖萬維陸續(xù)開源了百億級大語言模型「天工」Skywork-13B系列、數(shù)字智能體全流程研發(fā)工具包AgentStudio、4000億參數(shù)MoE超級模型、2千億稀疏大模型Skywork-MoE、推理模型Skywork-o1-Open等。2025年2月18日,昆侖萬維同時將SOTA級別的SkyReels-V1和SkyReels-A1進行開源。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在語言生成模型、AI Agent、推理模型、視頻生成模型等相繼開源、多點開花之后,我們正式開源Skywork R1V多模態(tài)推理模型,在文本-視覺多模態(tài)推理方向再下一城,成為中國第一家開源多模態(tài)思考模型的企業(yè)。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

中國企業(yè)過去一年在AI領(lǐng)域的開源貢獻,讓全世界AI從業(yè)者和開發(fā)者享受到了技術(shù)共享帶來的普惠發(fā)展。DeepSeek的開源為AI行業(yè)提供了新的發(fā)展范本,多項開源成果顯著降低了AI技術(shù)的應(yīng)用門檻、促進全球AI技術(shù)的民主化。昆侖萬維作為中國AI領(lǐng)軍企業(yè),我們將持續(xù)開源優(yōu)秀的模型、數(shù)據(jù)集等,共建開發(fā)者生態(tài)、加速技術(shù)創(chuàng)新、降低應(yīng)用門檻、推動技術(shù)平權(quán)和AI行業(yè)發(fā)展。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

此文內(nèi)容為企業(yè)供稿,僅供參考。3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com


3gQ即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

本文鏈接:http://www.enbeike.cn/news-14-7857-0.html昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態(tài)思考新時代

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:甜啦啦獲評2025年度特色茶飲十大品牌

下一篇:百利好:國際金價持續(xù)大漲后續(xù)走勢會怎樣?

為你推薦
春節(jié)想打麻將,但又無力招架親戚們在牌桌上的花式八卦盤問?那就來試試這款主打單人PVE的“i人麻將”吧! 點數(shù)無上限、構(gòu)筑無下限,一起來花式贏積分。在這個春節(jié),i...
01-27
Take-Two Interactive 首席執(zhí)行官 Strauss Zelnick 最近分享了一些對于 AI 人工智能的看法,稱“人工智能”這個概念實際上就是一個“矛盾修辭”。 在接受 GI.b...
02-10
極目新聞記者 詹钘通訊員 潘慶芳 周皓2月4日,極目新聞記者從湖北省春運辦了解到,春運前20天,該省全社會跨區(qū)域人員流動量累計3.07億人次,占比達到全國的十六分之一。春運以來,省...
02-04
據(jù)東方財經(jīng)報道,2月6日,大S離世后,張?zhí)m首度出鏡在抖音直播帶貨,直播間人氣達到10W+,一個多小時后突然遭到封禁。張?zhí)m直播時的截圖(圖源:個人賬號)直播時,張?zhí)m表示,自己過去三天經(jīng)歷了...
02-06
  IT之家1月20日消息,據(jù)臺媒《經(jīng)濟日報》今日報道,已退休的鴻海副總裁、前夏普會長戴正吳,因挽救...
01-21
2025年1月17日12時7分,由銀河航天抓總研制的中高層大氣臨邊探測遙感衛(wèi)星“天路一號”,在酒泉衛(wèi)星發(fā)射中心由長征二號丁運載火箭發(fā)射升空,順利進入預(yù)定...
01-21
  近日,省財政廳提前下達了2025年省數(shù)字經(jīng)濟專項資金1.8億元,支持我省各領(lǐng)域、各地區(qū)的數(shù)字經(jīng)濟全面發(fā)...
02-05
  隨著紐約時裝周啟動,2025年秋冬國際時裝周(倫敦、米蘭、巴黎)將在本周陸續(xù)拉開序幕。記者留意...
02-19
在一些學(xué)校,畢業(yè)后選擇工作的本科生越來越少了。過去幾周,包括清華大學(xué)、北京大學(xué)、復(fù)旦大學(xué)等多所知名高校公布了 2023-2024 學(xué)年的本科教學(xué)質(zhì)量報告,披露了包括畢業(yè)率、就...
01-21
  近日,教育部辦公廳印發(fā)《中小學(xué)科學(xué)教育工作指南》(以下簡稱《指南》)?!  吨改稀肪劢共粩嗤晟瓶茖W(xué)類課程體系建設(shè),改進和創(chuàng)新教學(xué)體系,加強師資隊伍建設(shè),保障教學(xué)實施...
01-22
1 月 24 日消息,比亞迪近日宣布,計劃于 2025 年首次在日本推出插電式混合動力汽車,以擴大其在日本市場的影響力。該市場長期以來由本土汽車制造商主導(dǎo)。據(jù)日經(jīng)亞洲報道...
01-25
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上線超過 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,這距離年初公布的2000 站的建站目標(biāo)...
01-25
  《難哄》溫以凡明明是喜歡桑延的,卻在高考后背棄了跟桑延的約定,還用言不由衷的借口拒絕了桑延?!峨y哄》溫以凡到底經(jīng)歷了什么?她為什么要拒絕桑延?   溫以凡本來跟桑延...
02-18
在璀璨奪目的娛樂圈內(nèi),何炅憑借其出色的主持能力和溫文爾雅的氣質(zhì),早已贏得了眾多粉絲的喜愛與尊敬。然而,近日,這位年過半百的知名主持人再度成為話題中心,原因竟是他那令人驚嘆...
02-22
  11月18日至24日是世界衛(wèi)生組織確定的“提高抗微生物藥物認識周”。當(dāng)前,抗生素使用情況如何?“新華視點”記者走訪多地進行調(diào)查...
01-21
21世紀(jì)經(jīng)濟報道記者武瑛港 實習(xí)生張爍 李依濃 北京報道近日多家醫(yī)療器械上市公司發(fā)布業(yè)績預(yù)告,行業(yè)的“寒冬”似乎仍在持續(xù)。樂普醫(yī)療和春...
02-09
    陳子元1991年參加中國科協(xié)第四次全國代表大會時寫下的會議記錄和心得體會。  老科學(xué)...
01-21
  在這個充滿歡樂與期待的寒假,當(dāng)同學(xué)們沉浸在放松、玩耍與探索的時光里,心理健康的維護同樣不容忽視。為了給同學(xué)們心靈披上溫暖的防護衣,擁抱陽光心態(tài),讓學(xué)生們掌握更多傳...
01-21
  近日,金融監(jiān)管總局發(fā)布《保險公司監(jiān)管評級辦法》(簡稱《評級辦法》),自2025年3月1日起施行。監(jiān)...
01-21
  原標(biāo)題:非上市壽險“成績單”出爐:59家公司共賺約247億元,超七成盈利,20家去年投資收益表現(xiàn)亮眼...
02-08
雙魚座的男生通常都是浪漫而敏感的,當(dāng)他們想念某個人時,會有一系列特別的行為和反應(yīng)。下...
01-22
水瓶座男生通常被認為是理性、獨立和冷靜的人。他們不容易表達自己的情感,因此要判斷一...
01-22
探秘莆田珠寶產(chǎn)業(yè)園:璀璨背后的故事與機遇在中國東南沿海的莆田,有一個閃耀著珠寶光澤的地方,那就是莆田珠寶產(chǎn)業(yè)園。走進這個行業(yè)前景光明的園區(qū),不僅能感受到璀璨的珠寶魅力,還...
02-07
格子襯衫搭配什么裙子好看?一、格子襯衫搭配什么裙子好看?  搭配方案一:格子襯衫+半身長裙  格子襯衫可以搭配有垂墜的褶皺長裙,浪漫氣息完美散發(fā)。但是最好選擇素色長裙,以...
02-12
2月9日消息,阿里云百煉全面上線DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款模型,即日起所有用戶可直接使用。DeepSeek-V3、DeepSeek-R1滿血版可享各100萬免...
02-09
2月17日消息,抖音電商近日發(fā)布了關(guān)于打擊網(wǎng)絡(luò)水軍的治理公告,從打擊虛假流量的源頭入手,保障消費者體驗。公告顯示,2024年,該平臺共清理了160萬個水軍賬號,日均攔截水軍評論超250...
02-18
進入2025年,大部分打工人的精神狀態(tài)都是:人坐在工位上,鼻子卻聞到了家中年夜飯的香。在年味不斷被稀釋,大部分春節(jié)習(xí)俗已絕跡的今天,對...
02-07
2月10日消息,四川省發(fā)展改革委(省數(shù)據(jù)局)公布2024年度四川省數(shù)字化轉(zhuǎn)型促進中心名單,共有18家申報單位獲得批復(fù)認定,四川合縱藥易購醫(yī)藥股份有限公司入選名單。這是四川省新修訂...
02-11
歲月悠悠,轉(zhuǎn)眼又是一年?;厥?024,中國式現(xiàn)代化進程持續(xù)推進,高質(zhì)量發(fā)展成為各行各業(yè)奮進的目標(biāo),時代巨變催促著各行各業(yè)加速轉(zhuǎn)型。作為社會“穩(wěn)定器”和經(jīng)濟“減震器”的保險業(yè)...
01-23
根據(jù)一份流傳到網(wǎng)上的內(nèi)部公告,1月24日,完美世界開除了百萬工作室四人,其違規(guī)行為包括在素材制作外包管理方面玩忽職守,構(gòu)成嚴重失職;利用公司資源、謀取利益,涉及金額巨大;內(nèi)外相...
02-09
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕