亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

“喂”給人工智能的真實數(shù)據終將耗盡,合成數(shù)據能否讓AI模型精確可靠?

6個月前 來源:中國科技網 觀看:168

人工智能(AI)初創(chuàng)公司xAI創(chuàng)始人埃隆·馬斯克近日表示:“在AI訓練中,我們現(xiàn)在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數(shù)據將在2到8年內消耗殆盡。鑒于真實數(shù)據日益稀缺,為滿足AI的“胃口”,科技行業(yè)正轉向使用合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

澳大利亞“對話”網站在本月稍早時間報道中指出,合成數(shù)據具有諸多優(yōu)勢,但過度依賴合成數(shù)據也可能削弱AI的精確性和可靠性。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

合成數(shù)據應運而生1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

以往,科技公司主要依賴真實數(shù)據來構建、訓練和改進AI模型。真實數(shù)據是指由人類創(chuàng)建的文本、視頻和圖像。它們通過調查、實驗、觀察或挖掘網站和社交媒體等途徑被收集而來。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

真實數(shù)據因蘊含真實事件以及其場景和背景而極具價值,但其并非盡善盡美。它可能摻雜拼寫錯誤、不一致或無關的內容,甚至潛藏嚴重偏見,導致生成式AI模型在某些情況下創(chuàng)建的圖像僅展示男性或白人形象。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

但真實數(shù)據日益匱乏,因為人類生成數(shù)據的速度趕不上AI不斷增長的需求。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

美國開放人工智能研究中心聯(lián)合創(chuàng)始人伊利亞·蘇茨克維爾在去年12月舉行的機器學習會議上聲稱,AI行業(yè)已觸及他所稱的“數(shù)據峰值”,AI的訓練數(shù)據如同化石燃料一樣面臨著耗盡的危機。此外,有研究預測,到2026年,ChatGPT等大型語言模型的訓練將耗盡互聯(lián)網上所有可用文本數(shù)據,屆時將沒有新的真實數(shù)據可供使用。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

為給AI提供充足的“養(yǎng)分”,一種由算法生成的、模仿真實世界情況的數(shù)據——合成數(shù)據應運而生。合成數(shù)據是在數(shù)字世界中創(chuàng)造的,而非從現(xiàn)實世界收集或測量而來。它可以作為真實世界數(shù)據的替代品,來訓練、測試、驗證AI模型。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

從理論上來說,合成數(shù)據為訓練AI模型提供了一種經濟高效且快捷的解決方案。它有效解決了AI訓練使用真實數(shù)據時飽受詬病的隱私問題和道德問題,尤其是涉及個人健康數(shù)據等敏感信息時。更重要的是,與真實數(shù)據不同,合成數(shù)據在理論上可以無限供應。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

研究機構高德納公司估計,2024年AI及分析項目使用的數(shù)據中,約60%是合成數(shù)據。到2030年,AI模型使用的絕大部分數(shù)據將是由AI生成的合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

科技公司來者不拒1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

事實上,微軟、元宇宙平臺公司,以及Anthropic等眾多科技頭部企業(yè)和初創(chuàng)企業(yè),已經開始廣泛使用合成數(shù)據來訓練其AI模型。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

例如,微軟在1月8日開源的AI模型“Phi-4”,便是合成數(shù)據攜手真實數(shù)據訓練的;谷歌的“Gemma”模型也采用了類似方法。Anthropic公司也利用部分合成數(shù)據,開發(fā)出其性能最優(yōu)異的AI系統(tǒng)之一“Claude 3.5 Sonnet”。蘋果自研AI系統(tǒng)Apple Intelligence,在預訓練階段,也大量使用了合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

隨著科技公司對合成數(shù)據的需求與日俱增,生產合成數(shù)據的工具也接踵而至。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

英偉達公司發(fā)布的3D仿真數(shù)據生成引擎Omniverse Replicator,能夠生成合成數(shù)據,用于自動駕駛汽車和機器人訓練。去年6月,英偉達開源了Nemotron-4340b系列模型,開發(fā)者可使用該模型生成合成數(shù)據,用于訓練大型語言模型,以應用于醫(yī)療保健、金融、制造、零售等行業(yè)。在醫(yī)療、金融等專業(yè)領域,該模型能夠根據特定需求生成高質量的合成數(shù)據,幫助構建更為精準的行業(yè)專屬模型。微軟推出的開源合成數(shù)據工具Synthetic Data Showcase則旨在通過生成合成數(shù)據和用戶界面,實現(xiàn)隱私保護的數(shù)據共享和分析。亞馬遜云科技推出的Amazon SageMaker Ground Truth也能為用戶生成數(shù)十萬張自動標記的合成圖像。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

此外,去年12月,元宇宙平臺公司推出開源大模型Llama 3.3,更是大幅降低了生成合成數(shù)據的成本。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

過度依賴風險難測1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

盡管合成數(shù)據暫時解決了AI訓練的燃眉之急,但它也并非盡善盡美。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

一個關鍵問題在于:當AI模型過于依賴合成數(shù)據時,它們可能會“崩潰”。它們會產生更多“幻覺”,編造看似合理可信但實際上并不存在的信息。而且,AI模型的質量和性能也會飛速下降,甚至無法使用。例如,某個AI模型生成的數(shù)據出現(xiàn)了一些拼寫錯誤,利用這些充滿了錯誤的數(shù)據訓練其他模型,這些AI模型必定會“以訛傳訛”,導致更大的錯誤。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

此外,合成數(shù)據也存在過于簡單化的風險。它可能缺乏真實數(shù)據集蘊含的細節(jié)和多樣性,這可能導致在其上訓練的AI模型的輸出也過于簡單,缺乏實用性。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

為解決這些問題,國際標準化組織需要著手創(chuàng)建強大的系統(tǒng),來跟蹤和驗證AI訓練數(shù)據。此外,AI系統(tǒng)可以配備元數(shù)據追蹤功能,讓用戶或系統(tǒng)能對合成數(shù)據進行溯源。人類也需要在AI模型的整個訓練過程中對合成數(shù)據進行監(jiān)督,以確保其高質量且符合道德標準。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

AI的未來在很大程度上取決于數(shù)據的質量,合成數(shù)據將在克服數(shù)據短缺方面發(fā)揮越來越重要的作用。對合成數(shù)據的使用,人們必須保持謹慎態(tài)度,盡量減少錯誤,確保其作為真實數(shù)據的可靠補充,從而保障AI系統(tǒng)的準確性和可信度。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

人工智能(AI)初創(chuàng)公司xAI創(chuàng)始人埃隆·馬斯克近日表示:“在AI訓練中,我們現(xiàn)在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數(shù)據將在2到8年內消耗殆盡。鑒于真實數(shù)據日益稀缺,為滿足AI的“胃口”,科技行業(yè)正轉向使用合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

澳大利亞“對話”網站在本月稍早時間報道中指出,合成數(shù)據具有諸多優(yōu)勢,但過度依賴合成數(shù)據也可能削弱AI的精確性和可靠性。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

合成數(shù)據應運而生1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

以往,科技公司主要依賴真實數(shù)據來構建、訓練和改進AI模型。真實數(shù)據是指由人類創(chuàng)建的文本、視頻和圖像。它們通過調查、實驗、觀察或挖掘網站和社交媒體等途徑被收集而來。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

真實數(shù)據因蘊含真實事件以及其場景和背景而極具價值,但其并非盡善盡美。它可能摻雜拼寫錯誤、不一致或無關的內容,甚至潛藏嚴重偏見,導致生成式AI模型在某些情況下創(chuàng)建的圖像僅展示男性或白人形象。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

但真實數(shù)據日益匱乏,因為人類生成數(shù)據的速度趕不上AI不斷增長的需求。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

美國開放人工智能研究中心聯(lián)合創(chuàng)始人伊利亞·蘇茨克維爾在去年12月舉行的機器學習會議上聲稱,AI行業(yè)已觸及他所稱的“數(shù)據峰值”,AI的訓練數(shù)據如同化石燃料一樣面臨著耗盡的危機。此外,有研究預測,到2026年,ChatGPT等大型語言模型的訓練將耗盡互聯(lián)網上所有可用文本數(shù)據,屆時將沒有新的真實數(shù)據可供使用。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

為給AI提供充足的“養(yǎng)分”,一種由算法生成的、模仿真實世界情況的數(shù)據——合成數(shù)據應運而生。合成數(shù)據是在數(shù)字世界中創(chuàng)造的,而非從現(xiàn)實世界收集或測量而來。它可以作為真實世界數(shù)據的替代品,來訓練、測試、驗證AI模型。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

從理論上來說,合成數(shù)據為訓練AI模型提供了一種經濟高效且快捷的解決方案。它有效解決了AI訓練使用真實數(shù)據時飽受詬病的隱私問題和道德問題,尤其是涉及個人健康數(shù)據等敏感信息時。更重要的是,與真實數(shù)據不同,合成數(shù)據在理論上可以無限供應。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

研究機構高德納公司估計,2024年AI及分析項目使用的數(shù)據中,約60%是合成數(shù)據。到2030年,AI模型使用的絕大部分數(shù)據將是由AI生成的合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

科技公司來者不拒1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

事實上,微軟、元宇宙平臺公司,以及Anthropic等眾多科技頭部企業(yè)和初創(chuàng)企業(yè),已經開始廣泛使用合成數(shù)據來訓練其AI模型。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

例如,微軟在1月8日開源的AI模型“Phi-4”,便是合成數(shù)據攜手真實數(shù)據訓練的;谷歌的“Gemma”模型也采用了類似方法。Anthropic公司也利用部分合成數(shù)據,開發(fā)出其性能最優(yōu)異的AI系統(tǒng)之一“Claude 3.5 Sonnet”。蘋果自研AI系統(tǒng)Apple Intelligence,在預訓練階段,也大量使用了合成數(shù)據。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

隨著科技公司對合成數(shù)據的需求與日俱增,生產合成數(shù)據的工具也接踵而至。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

英偉達公司發(fā)布的3D仿真數(shù)據生成引擎Omniverse Replicator,能夠生成合成數(shù)據,用于自動駕駛汽車和機器人訓練。去年6月,英偉達開源了Nemotron-4340b系列模型,開發(fā)者可使用該模型生成合成數(shù)據,用于訓練大型語言模型,以應用于醫(yī)療保健、金融、制造、零售等行業(yè)。在醫(yī)療、金融等專業(yè)領域,該模型能夠根據特定需求生成高質量的合成數(shù)據,幫助構建更為精準的行業(yè)專屬模型。微軟推出的開源合成數(shù)據工具Synthetic Data Showcase則旨在通過生成合成數(shù)據和用戶界面,實現(xiàn)隱私保護的數(shù)據共享和分析。亞馬遜云科技推出的Amazon SageMaker Ground Truth也能為用戶生成數(shù)十萬張自動標記的合成圖像。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

此外,去年12月,元宇宙平臺公司推出開源大模型Llama 3.3,更是大幅降低了生成合成數(shù)據的成本。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

過度依賴風險難測1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

盡管合成數(shù)據暫時解決了AI訓練的燃眉之急,但它也并非盡善盡美。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

一個關鍵問題在于:當AI模型過于依賴合成數(shù)據時,它們可能會“崩潰”。它們會產生更多“幻覺”,編造看似合理可信但實際上并不存在的信息。而且,AI模型的質量和性能也會飛速下降,甚至無法使用。例如,某個AI模型生成的數(shù)據出現(xiàn)了一些拼寫錯誤,利用這些充滿了錯誤的數(shù)據訓練其他模型,這些AI模型必定會“以訛傳訛”,導致更大的錯誤。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

此外,合成數(shù)據也存在過于簡單化的風險。它可能缺乏真實數(shù)據集蘊含的細節(jié)和多樣性,這可能導致在其上訓練的AI模型的輸出也過于簡單,缺乏實用性。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

為解決這些問題,國際標準化組織需要著手創(chuàng)建強大的系統(tǒng),來跟蹤和驗證AI訓練數(shù)據。此外,AI系統(tǒng)可以配備元數(shù)據追蹤功能,讓用戶或系統(tǒng)能對合成數(shù)據進行溯源。人類也需要在AI模型的整個訓練過程中對合成數(shù)據進行監(jiān)督,以確保其高質量且符合道德標準。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

AI的未來在很大程度上取決于數(shù)據的質量,合成數(shù)據將在克服數(shù)據短缺方面發(fā)揮越來越重要的作用。對合成數(shù)據的使用,人們必須保持謹慎態(tài)度,盡量減少錯誤,確保其作為真實數(shù)據的可靠補充,從而保障AI系統(tǒng)的準確性和可信度。1Jr即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.enbeike.cn/news-2-217-0.html“喂”給人工智能的真實數(shù)據終將耗盡,合成數(shù)據能否讓AI模型精確可靠?

聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。

上一篇:仿昆蟲微型機器人飛行長達15分鐘

下一篇:新型光學原子鐘比銫鐘精度高千倍

為你推薦
近日,完美世界(002624.SZ)發(fā)布2024年度業(yè)績預告。預告顯示,完美世界去年全年預計實現(xiàn)營業(yè)收入55億元至56億元,預計歸母凈利潤為虧損11...
01-21
1月7日,哈電集團哈爾濱電氣國際工程有限責任公司(以下簡稱“哈電集團國際公司”)、天津市河西區(qū)政府聯(lián)合舉辦“三改聯(lián)動”專題交流會。記者從會上獲悉...
01-24
  近日,《遼寧省沿海港口布局規(guī)劃(2024—2035年)》(以下簡稱《規(guī)劃》)正式出臺。我省是2023年全國港口航道...
02-05
  今年,遼寧海參、人參、草莓、藍莓、櫻桃、盤錦大米、河蟹、食用菌、小?;ㄉ⒚坊沟?0個有特色優(yōu)...
02-11
  “索要千萬逼死丈夫”案的翟欣欣因涉嫌犯敲詐勒索罪,案件將于今日開庭。  蘇享茂的哥哥蘇享龍此前也曾對外發(fā)布消息,說已接法院通知,翟欣欣涉嫌敲詐勒索一案,定于2025...
01-21
  春節(jié)臨近,隨著打工人年終獎的陸續(xù)到賬,一場年味兒十足的年終獎“理財檔”也迅速拉開序幕。近日,記者走訪發(fā)現(xiàn),各大銀行瞄準市民年終獎投資需求,紛紛推出新春專屬理財新品,...
01-22
1 月 21 日消息,美國東部時間 20 日中午,特朗普在國會大廈圓形大廳宣誓就任美國第 47 任總統(tǒng)。特朗普隨后發(fā)表就職演講,他在一項行政命令中表示,將下令其政府“取消電動...
01-22
1 月 24 日消息,本月 10 號,備受關注的特斯拉煥新 Model Y 正式開啟預售。相比舊版本漲價 1.26~1.36 萬元,預計 3 月開始交付,其中:后輪驅動首發(fā)版(593km 標準續(xù)航)26.35 ...
01-25
SQL Error: select * from ***_ecms_news5 where id in(14,) limit 2
1月22日,國家衛(wèi)健委、國家中醫(yī)藥局聯(lián)合發(fā)布《流行性感冒診療方案(2025年版)》,新增瑪巴洛沙韋、法維拉韋兩種抗流感病毒藥物,并明確不建議聯(lián)合...
01-23
21世紀經濟報道記者 唐唯珂 廣州報道代糖產業(yè)也被卷入貿易壓力。近期,中國赤蘚糖醇行業(yè)面臨來自歐盟和美國的雙重貿易壓力。2025年1月16日,...
02-08
  大眾網記者 楊濤報道  11月19日,白俄羅斯共和國職業(yè)教育研究院校長戈盧博夫斯基?瓦萊里?尼古拉耶維奇副教授, 國際合作中心主任科列伊妮娜?奧爾加?瓦列耶夫娜一...
01-21
近日,人民網遼寧頻道、中央廣播電視總臺遼寧總站、光明日報遼寧記者站、中國日報遼寧記者站、中新社遼寧...
01-21
  中國平安人壽保險股份有限公司(以下簡稱“平安人壽”)近日發(fā)布公告稱,平安資管受托該公司資金,...
01-24
  四家上市險企業(yè)績預增  股債共振推動利潤預期改善  □記者 張小潔 北京報道  中國太...
02-05
摩羯座的男生通常給人一種穩(wěn)重、務實的印象,他們對感情也是非常認真和專注的。如果你想...
01-22
雙子座的男生喜歡聰明、機智和有趣的人。他們對于細節(jié)非常敏感,因此如果你想要感動一個...
01-22
解讀米雅潮流服飾:追尋時尚與個性的完美結合時尚界總是瞬息萬變,品牌如雨后春筍般涌現(xiàn),但能讓人銘記的卻屈指可數(shù)。米雅潮流服飾,這個新興品牌,憑借其獨特的風格與設計理念,迅速吸...
02-07
聚光燈下的全女明星:她們的故事與智慧在娛樂圈中,有一類星光璀璨的女性,她們不僅在熒幕上展現(xiàn)了非凡的才華,也在生活中給人們帶來了無盡的感動與啟發(fā)。這便是我們常說的全女明星...
02-12
2月11日消息,天眼查App顯示,近日,合肥三只羊網絡科技有限公司、廣州市美誠食品有限公司等新增一則開庭公告,原告為許某,案由為信息網絡買賣合同糾紛,該案將于4月2日在福建南平市建...
02-12
2月12日消息,據復旦消費大數(shù)據實驗室數(shù)據,網上年貨節(jié)期間(1月7日至2月5日)廣州市網上零售總額達956.4億元,相比去年同期增長4.58%。各大電商平臺推出豐富多彩的活動優(yōu)惠,實現(xiàn)銷售...
02-13
2月6日消息,交通部門預計,今年春運期間,自駕出行預計達到72億人次,約占全社會跨區(qū)域人員流動量的八成,高速公路車流量單日峰值或創(chuàng)歷史新高。全球自駕游平臺租租車數(shù)據顯示,春節(jié)期...
02-07
2月9日消息,文化和旅游部近日公布2024年全國智慧旅游十佳解決方案和2024年全國智慧旅游優(yōu)秀解決方案名單?!皵y程入境游景區(qū)融合服務平臺解決方案”脫穎而出,榮獲十佳解決方案...
02-09
全球性金融券商集團英國EBC Group平臺始終致力于以領先生態(tài),與全球交易者共塑交易的未來。 自第一屆交易大賽起,為赤忱的熱愛和卓越的才華提供舞臺,在全球內尋找交易好手以賦能...
01-24
近日,宿遷時代儲能科技有限公司(簡稱“宿遷時代儲能”)完成A+輪數(shù)億元融資。本輪融資由北京綠色能源基金領投,昌平能源智造基金、南京邦盛資本、北京...
02-07
無人深空》作為一款讓玩家沉浸在浩瀚宇宙中的冒險游戲,再次帶來了讓人期待已久的更新——《世界 第二部分》。這一次,開發(fā)者不單單滿足于擴大游戲的星系范圍,更是...
02-01
《天國:拯救2》雖然有一些爭議,但這并沒有阻止游戲深受廣大玩家的喜愛。該作首發(fā)24小時銷量破百萬,僅用了一天時間就收回了4100萬美元的成本。 更能說明的是,《天...
02-10
央視網消息:商務部數(shù)據顯示,2024年,中國服務貿易實現(xiàn)快速增長,全年服務進出口總額首次突破1萬億美元,規(guī)模創(chuàng)下歷史新高,結構持續(xù)優(yōu)化,展現(xiàn)出廣闊的發(fā)展?jié)摿Α?024年,中國全年服務進...
02-04
據環(huán)球時報援引日本《產經新聞》2日報道,自2024年12月下旬流感病例數(shù)創(chuàng)新高后,日本多地藥店表示已無用于治療感冒、發(fā)燒等疾病藥品的庫存。此外,一些過于擁擠的醫(yī)院也建議患者...
02-04
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕