亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

DeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

3個月前 來源:新華網(wǎng) 觀看:50

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域?qū)崿F(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產(chǎn)生哪些影響?nJy即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新nJy即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產(chǎn)生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產(chǎn)生了非常驚人的效果。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產(chǎn)生包括“多語言混雜”在內(nèi)的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調(diào)優(yōu)化),從而產(chǎn)生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變nJy即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質(zhì)在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……nJy即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內(nèi)大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調(diào)底層代碼來優(yōu)化性能,從而解決“連接通信能力和調(diào)度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域?qū)崿F(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產(chǎn)生哪些影響?nJy即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新nJy即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產(chǎn)生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產(chǎn)生了非常驚人的效果。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產(chǎn)生包括“多語言混雜”在內(nèi)的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調(diào)優(yōu)化),從而產(chǎn)生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變nJy即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯nJy即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質(zhì)在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……nJy即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內(nèi)大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調(diào)底層代碼來優(yōu)化性能,從而解決“連接通信能力和調(diào)度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。nJy即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.enbeike.cn/news-2-674-0.htmlDeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:中央網(wǎng)信辦部署推進2025年信息化重點工作

下一篇:小心AI伴侶背后的“溫柔陷阱”

為你推薦
記者從中國載人航天工程辦公室獲悉,我國2025年計劃發(fā)射神舟二十號、神舟二十一號兩艘載人飛船和天舟九號貨運飛船。1月20日,三次飛行任務的任務標識...
01-21
1月14日,記者從中國科學院合肥物質(zhì)科學研究院等離子體物理研究所(以下簡稱“等離子體所”)獲悉,由該所建設運行的國家重大科技基礎設施“聚變堆主機關...
01-21
  攻堅之年,遼寧戰(zhàn)績?nèi)绾?社會各界十分關注。  1月19日,省政府新聞辦召開的2024年全省經(jīng)濟運行情況新...
01-21
  1月27日夜間,紛紛揚揚的大雪已下了一整天,白雪覆紅燈讓年味愈發(fā)濃厚。在沈陽街頭,環(huán)衛(wèi)工人們揮舞鐵鍬...
01-28
  日前,浙江大學發(fā)布消息,傅園慧正式入職,入職后的工作內(nèi)容公布。隸屬于浙大公共體育與藝術部,教學為主崗。目前,傅園慧還只試上過一節(jié)游泳課,主要是教了蛙泳,她希望能夠更多...
01-21
春節(jié)臨近,年味漸濃。每到除夕前幾天,置辦年貨成了消費者日常生活中的“頭等大事”。年貨種類繁多,尤其是食品類年貨更是多種多樣,其中又以四川特產(chǎn)年貨最受全國消費者歡迎。從麻...
01-22
1 月 24 日消息,比亞迪汽車昨晚宣布,旗下新能源豪華智能皮卡 ——BYD SHARK 正式登陸厄瓜多爾市場?!?圖源:比亞迪比亞迪表示,新車外觀靈感源自鯊魚的靈動與霸氣,改變傳...
01-24
“若前方無路,我便踏出一條路;若天理不容,我便扭轉(zhuǎn)這乾坤。”電影《哪吒2》開年“王炸”,讓人看到了哪吒打破命運,勇敢做自己,最終活出自我的過程。新年剛過,國內(nèi)車市異?!伴_卷”,...
02-06
  1、《難哄》桑稚扮演者是劉楚恬,劉楚恬在劇中演的是男主的妹妹,比桑延小六歲。  2、劉楚恬是05后童星,2009年出生的她兩歲的時候就開始進入演藝圈了?! ?、作為演員,劉...
02-14
《余燼之上》在哪播出?是翻拍的嗎?《余燼之上》于2025年2月8日在騰訊視頻播出。?《余燼之上》不是翻拍劇,而是原創(chuàng)劇本?。該劇由王子奇和孫陽等人主演,五百擔...
02-21
  新華社北京12月18日電 12月18日,《新華每日電訊》發(fā)表題為《人均預期78.6歲,如何迎接長壽“新常態(tài)”?》的報道。 &emsp...
01-21
21世紀經(jīng)濟報道記者季媛媛 上海報道 “復星醫(yī)藥私有化復宏漢霖”有了定論。1月22日,復星醫(yī)藥發(fā)布公告,控股子公司復星新藥擬以現(xiàn)金及/或換...
01-23
  大眾網(wǎng)記者 司心鵬 報道  為貫徹落實教育部、山東省《關于加強新時代教育科學研究工作的實施意見》,提高特殊教育教師教科研水平,促進特殊教育教師專業(yè)成長,2024年12...
01-21
  大眾網(wǎng)記者 王一剛 報道  1.暖·冬至  冬至,在我國農(nóng)歷的舞臺上,它不僅是一個至關重要的節(jié)氣,更是一場闔家團圓、傳承民俗的文化盛宴?! 榱嗽谟變盒牡追N下傳統(tǒng)...
01-21
  財中社1月20日電國信證券發(fā)布農(nóng)林牧漁行業(yè)農(nóng)產(chǎn)品研究跟蹤系列報告。文中指出看好豬價2025年...
01-21
  觀點網(wǎng)訊:1月20日,匯賢產(chǎn)業(yè)信托宣布償還貸款及其財務影響?! 」骘@示,于2025年1月20日,匯賢...
01-21
白羊座的男生通常充滿活力、冒險精神和自信心。他們喜歡追求刺激和挑戰(zhàn),對于生活充滿了...
01-22
天蝎座的男生通常都有著強烈的個人魅力和吸引力,因此很容易吸引到一些暗戀他們的女生。...
01-22
矮個子男生穿搭? 155矮個子男生穿搭?一、矮個子男生穿搭?1.腰部高出5cm-7cm矮個子男生選擇男士褲子時,腰部高出5cm-7cm是最好的。這樣的選購小心機,對小個子男生來說很適用。2.腳...
02-17
揭開羽絨服價格背后的秘密,買到理想款式不再難當我們的目光被初冬的寒風所撩動時,羽絨服無疑成了大家衣櫥中的寵兒。然而,面對市場上琳瑯滿目的羽絨服和千差萬別的價格,我常常思...
02-17
2月5日消息,朋湖網(wǎng)近日聯(lián)合機器人開放社區(qū)發(fā)布“2024年度科技產(chǎn)業(yè)系列榜單”,商越科技憑借自身的采購數(shù)字化技術創(chuàng)新、服務能力、市場競爭力及社會價值,入選“2024企業(yè)服務創(chuàng)新...
02-07
2月9日消息,抖音商城情人節(jié)活動日前正式啟動,2月8日-14日,抖音電商將投入海量的流量激勵和用戶補貼,鼓勵商家達人贏得春節(jié)后業(yè)績的快速恢復和爆發(fā)增長。本次大促活動依托平臺全...
02-09
2月4日消息,攜程發(fā)布《2025年春節(jié)旅游總結報告》,報告顯示,超半數(shù)游客集中在初五、初六返程,8天假期的靈活性也讓不少游客選擇延長旅途,節(jié)后錯峰返程??缇秤握w訂單同比去年增...
02-07
2月23日消息,在線旅游預訂公司Booking公布2024年第四季度和全年業(yè)績。財報顯示,2024年第四季度,Booking客房預訂夜數(shù)增長13%至2.61億;總預訂額同比增長約17%至372億美元;收入同比...
02-24
【#小紅書1500萬在杭州成立新公司# #小紅書新公司叫棋行科技#】天眼查App顯示,近日,棋行科技(杭州)有限公司成立,法定代表人為張雷,注冊資本1500萬人民幣,經(jīng)營范圍含社會經(jīng)濟咨詢服...
01-21
【#交銀投資等在陜西成立航空航天股權基金# 出資額10億】天眼查App顯示,近日,陜西財金交匯航空航天新動能股權投資產(chǎn)業(yè)基金合伙企業(yè)(有限合伙)成立,執(zhí)行事務合伙人為陜西空天宏遠...
01-21
近日武俠電影《笑傲江湖》角色海報發(fā)布。天下英雄各展身手,誰能最終問鼎武林?江湖恩怨諸多是非,還請諸君敬請期待! 《笑傲江湖》電影將于1月28日(除夕)在騰訊視頻...
01-25
開發(fā)商 id Software 于 5 年前推出了《毀滅戰(zhàn)士:永恒》,并即將推出《毀滅戰(zhàn)士:黑暗紀元》。即便這是公司推出的新《毀滅戰(zhàn)士》系列的前傳,但顯然它將比開發(fā)商之前...
01-28
極目新聞記者 周治濤“這一杯要敬侄女,感謝去年直播幫我賣山貨賺了幾千元。”大年初二,家住湖北宜昌鄂西山區(qū)五峰土家族自治縣的曾春林,到舅舅家拜年,飯桌上舅舅對她連連致謝。...
02-04
據(jù)西安頭條2月5日消息,陜西省第十一屆人大常委會副主任,陜西省政府原副省長,陜西省總工會原主席黨組書記,著名作家白阿瑩同志因病醫(yī)治無效,于2025年2月5日9時56分在西安逝世,享年7...
02-06
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕