亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

AI醫(yī)療進(jìn)入精準(zhǔn)化“深水區(qū)” :OpenAI醫(yī)療評估基準(zhǔn)落地、大模型加速變革|AI醫(yī)療浪潮?

1個月前 來源: 觀看:50

21世紀(jì)經(jīng)濟(jì)報道記者 閆碩 北京報道0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

近日,OpenAI推出HealthBench開源基準(zhǔn)測試,用于衡量大語言模型在醫(yī)療健康領(lǐng)域的性能表現(xiàn)與安全可靠性,引發(fā)業(yè)內(nèi)廣泛討論。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

根據(jù)官方信息,HealthBench由262位來自60個國家/地區(qū)執(zhí)業(yè)的醫(yī)生共同參與構(gòu)建,整合了5000段真實的醫(yī)療對話數(shù)據(jù)。與以前的狹窄基準(zhǔn)不同,HealthBench通過48562個獨特的醫(yī)生編寫的評分標(biāo)準(zhǔn)進(jìn)行有意義的開放式評估,涵蓋多個健康背景和行為維度。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有研報分析指出,隨著OpenAI推出HealthBench等醫(yī)療大模型評估基準(zhǔn)的建立和完善,AI醫(yī)療模型的性能評估將更加科學(xué)、全面,有助于加速AI技術(shù)在醫(yī)療領(lǐng)域的落地應(yīng)用,為醫(yī)療行業(yè)的智能化升級提供有力支持,相關(guān)企業(yè)有望迎來新的發(fā)展機(jī)遇。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

另一方面,大模型本身也在加速變革。事實上,隨著大模型競爭的白熱化,競爭的焦點也已進(jìn)入全新階段:從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)變?yōu)槟P托蕛?yōu)化與單位算力下的性能提升。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

IQVIA艾昆緯戰(zhàn)略規(guī)劃副總監(jiān)Barrett Li向21世紀(jì)經(jīng)濟(jì)報道記者表示,隨著大模型的不斷進(jìn)化,以及模型優(yōu)化方法的不斷提升,已經(jīng)為AI在要求更特殊的專業(yè)場景中的更廣泛應(yīng)用拓展了可能性,尤其是對于醫(yī)藥行業(yè)的AI應(yīng)用來說,已顯現(xiàn)三大趨勢:模型即產(chǎn)品、本地與端側(cè)部署、研發(fā)端AI應(yīng)用的快速拓展。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

新的評估測試集

改善人類健康將成為通用人工智能(AGI)的決定性影響之一。如果能夠得到有效開發(fā)和部署,大語言模型有望拓展健康信息的獲取渠道,支持臨床醫(yī)生提供高質(zhì)量醫(yī)療服務(wù),并幫助人們維護(hù)自身健康。而評估對于理解模型在醫(yī)療場景中的表現(xiàn)至關(guān)重要。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

OpenAI認(rèn)為,現(xiàn)有評估仍然存在一些問題,首先,未反映真實場景,脫離了實際醫(yī)療互動的復(fù)雜性,如僅采用標(biāo)準(zhǔn)化測試或有限臨床問題。其次,缺乏專家醫(yī)學(xué)驗證,評分標(biāo)準(zhǔn)未經(jīng)過醫(yī)療專家嚴(yán)格審核,難以體現(xiàn)專業(yè)醫(yī)療判斷。此外,也并未預(yù)留改進(jìn)空間,最先進(jìn)模型已接近“天花板”得分,無法激勵持續(xù)優(yōu)化。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,在過去的一年里,OpenAI與60個國家的262名醫(yī)生合作構(gòu)建了HealthBench,包括5000個真實的醫(yī)療對話數(shù)據(jù)。HealthBench 的測試樣本被分為7個主題和5個評估維度。其中,7個主題包括緊急轉(zhuǎn)診、專業(yè)溝通定制、健康數(shù)據(jù)任務(wù)等方面,5個評估緯度則包含準(zhǔn)確性、溝通質(zhì)量、情境理解等方面。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在HealthBench的基礎(chǔ)上,OpenAI還推出了兩個特別版本:HealthBench Consensus(共識版)和HealthBench Hard(困難版)。前者包含34個經(jīng)醫(yī)生共識驗證的、對模型行為表現(xiàn)尤為關(guān)鍵的評估維度;后者則設(shè)置了更高難度的評估場景,目前最高得分僅為o3模型的32%,主要被用于挑戰(zhàn)模型在復(fù)雜醫(yī)療情境中的極限表現(xiàn)。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

對于HealthBench的可信度,OpenAI開展了HealthBench Consensus(共識版)的元評估,即將模型的打分結(jié)果與醫(yī)生人工打分進(jìn)行對比。結(jié)果表明,7個評估領(lǐng)域中的6個領(lǐng)域,模型打分結(jié)果與醫(yī)生評分的中位數(shù)水平高度一致。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有券商分析師向21世紀(jì)經(jīng)濟(jì)報道記者表示,在醫(yī)療等垂直領(lǐng)域,準(zhǔn)確性和實際場景的相關(guān)性比“流暢對話”更為關(guān)鍵,HealthBench不同于過去大多關(guān)注通用大語言模型表現(xiàn)的基準(zhǔn),而是聚焦醫(yī)療垂直領(lǐng)域,為醫(yī)療領(lǐng)域的AI應(yīng)用提供更為專業(yè)的評估工具,同時也將推動大模型領(lǐng)域建立專業(yè)的AI評估標(biāo)準(zhǔn)。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

值得一提的是,在HealthBench的測評中可以發(fā)現(xiàn),大模型在醫(yī)療領(lǐng)域的應(yīng)用正迅速發(fā)展。比如,2023年推出的GPT-3.5Turbo得分為16%,而2024年5月推出的GPT-4o得分已達(dá)到32%,2024年12月推出的o3模型得分更是達(dá)到60%。另外,較小規(guī)模的模型尤其進(jìn)步顯著,GPT-4.1 nano的表現(xiàn)超過GPT-4o,且成本僅為GPT-4o的1/25。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

大模型持續(xù)優(yōu)化

根據(jù)世界經(jīng)濟(jì)論壇發(fā)布的《人工智能驅(qū)動健康的未來:引領(lǐng)潮流》報告,人工智能是醫(yī)療保健的主要變革力量,預(yù)計2024年—2032年,AI醫(yī)療市場將以每年43%的速度增長,市場規(guī)模有望達(dá)到4910億美元。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其中,AI在醫(yī)療服務(wù)中的應(yīng)用前景廣闊。中信建投證券分析指出,AI可以擴(kuò)展醫(yī)療服務(wù)可及性,可應(yīng)用于診斷前、診治及診斷后階段,解決當(dāng)前醫(yī)院系統(tǒng)醫(yī)療人員短缺和缺乏有效分流等問題,以少量資源實現(xiàn)高效率。此外,AI輔助醫(yī)生診療未來有望降低誤診率的同時,在部分疑難雜癥診療方面也有望發(fā)揮協(xié)同作用。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,不僅評估工具在發(fā)生變革,大模型本身也在持續(xù)優(yōu)化。當(dāng)前,AI在醫(yī)療領(lǐng)域的應(yīng)用歷經(jīng)了從規(guī)則驅(qū)動到數(shù)據(jù)驅(qū)動、從單一任務(wù)優(yōu)化到多模態(tài)協(xié)同的演變,已進(jìn)入到多模態(tài)融合階段。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

浙商證券分析指出,大模型的多模態(tài)能力解決了早期AI醫(yī)療存在的信息割裂和數(shù)據(jù)孤島等問題,大模型通過“預(yù)訓(xùn)練+微調(diào)”架構(gòu),用統(tǒng)一參數(shù)體系處理多模態(tài)醫(yī)療數(shù)據(jù)。在臨床應(yīng)用中,借助多模態(tài)技術(shù),AI可以實現(xiàn)跨模態(tài)數(shù)據(jù)的理解和動態(tài)時序建模,使得AI診療與醫(yī)生的診療水平更加接近。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

需要指出的是,由于萬億級參數(shù)模型高昂的訓(xùn)練成本與當(dāng)下較低的投資回報比,疊加通用參數(shù)的堆砌對專業(yè)場景下的模型效率提升遇到了瓶頸,大模型競爭的焦點已從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)向模型效率優(yōu)化與單位算力下的性能提升。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在應(yīng)用方面,Barrett Li向記者總結(jié)道,隨著大模型的不斷進(jìn)化,目前對于醫(yī)藥行業(yè)的AI應(yīng)用來說,幾大趨勢已經(jīng)顯現(xiàn):0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

首先,模型即產(chǎn)品。相比通用大模型在其他行業(yè)中相對較低的應(yīng)用門檻,醫(yī)藥行業(yè)高度專業(yè)性的場景,對于模型的適配性有著更高的要求。而隨著模型訓(xùn)練與針對特定知識庫優(yōu)化的技術(shù)與應(yīng)用逐漸推廣,大模型廠商未來預(yù)計會逐步關(guān)閉對外的API接口,轉(zhuǎn)而將專業(yè)化后的模型本身作為產(chǎn)品直接提供給企業(yè)用戶使用,顛覆現(xiàn)有的套殼應(yīng)用層。而現(xiàn)有的專業(yè)AI軟件,也必須逐步增強(qiáng)其底層模型訓(xùn)練的能力以應(yīng)對這一挑戰(zhàn)。在可見的未來,將會有更多直接針對醫(yī)藥行業(yè)訓(xùn)練的模型被廣泛應(yīng)用。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其次,本地與端側(cè)部署。針對特定場景而訓(xùn)練優(yōu)化的專業(yè)模型,可以在滿足性能要求的前提下,減少對硬件方面提出過高的要求。因此在成本可控性、分析可溯源、數(shù)據(jù)安全、反饋延遲等要求更高的場景下,專業(yè)中小模型的本地部署會提供極大的賦能。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

“此外,研發(fā)端AI應(yīng)用也在快速拓展。出于高度專業(yè)性、數(shù)據(jù)安全、隱私合規(guī)等因素,相比通用大模型在商業(yè)化階段的快速發(fā)展,醫(yī)藥行業(yè)企業(yè)尚未在研發(fā)階段感受到AI所帶來的巨大轉(zhuǎn)變。而隨著特定場景專業(yè)模型訓(xùn)練的普及,研發(fā)階段AI應(yīng)用的壁壘未來也有望被逐一消解?!盉arrett Li說道。0LL即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

本文鏈接:http://www.enbeike.cn/news-7-17974-0.htmlAI醫(yī)療進(jìn)入精準(zhǔn)化“深水區(qū)” :OpenAI醫(yī)療評估基準(zhǔn)落地、大模型加速變革|AI醫(yī)療浪潮?

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:CXO企業(yè)一季報:5家營收破10億元,8家虧損,國際化與創(chuàng)新賽道或成破局關(guān)鍵

下一篇:交易超10億美金,石藥這款首仿藥何以搶灘全球市場?

為你推薦
這里是《21健訊Daily》,歡迎與21世紀(jì)經(jīng)濟(jì)報道新健康團(tuán)隊共同關(guān)注醫(yī)藥健康行業(yè)最新事件!政策動向安徽將牽頭開展全國生物藥聯(lián)盟集采1月14日,安...
01-21
這里是《21健訊Daily》,歡迎與21世紀(jì)經(jīng)濟(jì)報道新健康團(tuán)隊共同關(guān)注醫(yī)藥健康行業(yè)最新事件!政策動向國家藥監(jiān)局藥審中心發(fā)布《地中海貧血基因治...
02-10
  大眾網(wǎng)記者 楊濤報道  日前,“外研社·國才杯”“理解當(dāng)代中國”全國大學(xué)生外語能力演講大賽(山東賽區(qū)高職組)成績揭曉,青島港灣職業(yè)技術(shù)學(xué)院的王淑珍同學(xué)憑借出色的表...
01-21
  今天我和華商童學(xué)會小記者一行50多人來到了浐灞公安局,親自了解體驗警察叔叔工作的一天。說到這里,我猜大家都想知道公安局里是什么樣子,公安局都有什么工作內(nèi)容、審訊犯...
01-21
  摘要  【特朗普打壓國際油價大震蕩!未來還有哪些新變數(shù)?】在美國總統(tǒng)特朗普的打壓下,國際油...
01-27
經(jīng)濟(jì)觀察網(wǎng) 邢祺欣/文 6月19日,惠譽(yù)評級在北京舉行的“2024惠譽(yù)看中國”會議上,發(fā)布《中國主權(quán)評級及宏觀經(jīng)濟(jì)前景展望》報告。對中國政府近期采取的支持經(jīng)濟(jì)的措施,惠譽(yù)評級中...
02-13
獅子座男孩通常自信、勇敢,喜歡成為眾人焦點。然而,有時候我們可能想開個玩笑或者捉弄一...
01-22
天蝎座男生通常被認(rèn)為是神秘、深沉而又充滿魅力的存在。他們對愛情有著極高的要求,很難...
01-22
打造成功飾品品牌:你的創(chuàng)業(yè)項目計劃書指南你是否曾經(jīng)夢想過創(chuàng)建一個屬于自己的飾品品牌?想象一下,自己設(shè)計的獨特項鏈、耳環(huán)或者手鏈被人們喜愛和追捧,這種感覺無疑是令人激動的...
02-07
貴牛服飾品牌怎么樣? uc品牌女裝貴嗎?貴牛服飾品牌怎么樣?上海貴牛貿(mào)易有限公司成立于2013年, 總部設(shè)在廣東省經(jīng)濟(jì)、 文化、貿(mào)易中心城市---廣州市。是一家集生產(chǎn)、批發(fā)、銷售...
02-12
2月10日消息,攜程商旅獲得茶百道頒發(fā)的“2024年度優(yōu)秀供應(yīng)商”獎項。圖源:公眾號“攜程商旅資訊號”據(jù)了解,作為國民級茶飲品牌,茶百道發(fā)源于“天府之國”,以“好茶為底,制造新鮮...
02-11
2月19日消息,阿里云墨西哥數(shù)據(jù)中心今日正式啟用,這是阿里云在拉美區(qū)域的第一座數(shù)據(jù)中心,為中國出海企業(yè)及當(dāng)?shù)乜蛻籼峁┊a(chǎn)品及服務(wù)。阿里云墨西哥數(shù)據(jù)中心首批上線的產(chǎn)品涵蓋彈...
02-20
2月13日消息,螞蟻國際在利雅得正式開設(shè)了其首個中東辦事處,標(biāo)志著其全球擴(kuò)張邁出了重要一步。此前,該公司已獲得沙特中央銀行 (SAMA) 的認(rèn)證,獲準(zhǔn)在沙特阿拉伯的金融科技生態(tài)系...
02-14
3月3日消息,智聯(lián)招聘發(fā)布第四期《2025年春招市場行情周報》,盤點春節(jié)后一個月招聘求職趨勢。節(jié)后第四周,企業(yè)招聘需求繼續(xù)全面釋放,招聘環(huán)比增速TOP10職業(yè)涵蓋運(yùn)動健身、家政/維...
03-04
金陵華軟科技股份有限公司(以下簡稱“華軟科技”)于2025年1月18日發(fā)布了2024年度業(yè)績預(yù)告。盡管公司預(yù)計2024年凈利潤仍為負(fù)值,但從整體情況來看,華軟科技正在逐步擺脫困境,展現(xiàn)...
01-21
2024年12月14日 消息,杭州曉商圈網(wǎng)絡(luò)科技有限公司(簡稱“曉商圈”),今日獲得深圳市冠峰永越投資有限公司(簡稱“冠峰資本”)三千萬人民幣的戰(zhàn)略投資。曉...
02-07
世界首富馬斯克花錢找代練代打游戲已是眾人皆知的事情,然而政治立場和馬斯克敵對的媒體IGN,今日發(fā)文公開質(zhì)疑暴雪和GGG不作為——不封馬斯克的賬號,給這兩家公司...
01-27
不知大家發(fā)現(xiàn)沒有,我們在晚上做決定的時候,總會“大膽”很多,但第二天醒來不免會懊惱。這種到了晚上更易做出沖動決定的現(xiàn)象,在心理學(xué)上叫“深夜效應(yīng)”。 白天大...
02-10
極目新聞記者 吳昌華通訊員 胡子昂 何周諦2025年2月2日,農(nóng)歷正月初五,武漢歸元寺迎來群眾敬香祈福高峰。當(dāng)天清晨,天還沒亮,已有不少人等候在歸元寺外,武漢公安民警、輔警早已在...
02-03
在上海交通大學(xué)閔行校園的西區(qū),旭華路是一條幾乎貫穿南北的道路。開學(xué)時節(jié),這幾乎是全校最熱鬧的道路之一,沿旭華路一路穿行,會經(jīng)過學(xué)生宿舍、體育場、用餐區(qū)、快遞區(qū)、活動場館...
02-08
圖源:圖蟲創(chuàng)意 業(yè)績連虧多年的夢網(wǎng)科技(002123.SZ)因一則并...
01-21
從“神一”到“神十九”,25年間,中國航天帶給世界無數(shù)次驚喜,人們對航天員在軌期間的工作、生活情況等也越來越關(guān)注。未來,隨著我國載人航天工程、載人...
01-21
  隨著春節(jié)臨近,年味兒漸濃。除了傳統(tǒng)年貨,這幾年,具有觀賞價值、承載美好寓意的年宵花,成為不少...
01-21
  從1月15日召開的甘肅省文物局局長會議上獲悉,2024年甘肅省新增博物館9家、累計達(dá)257家,每9.6...
01-22
新年伊始,從空中運(yùn)輸,到海上航行,我國各個港口貨物來往穿梭,一派繁忙景象。多地增開國際貨運(yùn)航線,立體交通外貿(mào)網(wǎng)絡(luò)織密中國與世界的連接。新年伊始,墨西哥奧勝航空的全貨機(jī)滿載鮮...
01-21
  中新經(jīng)緯1月17日電 (袁媛)2025年,全球經(jīng)濟(jì)面臨增長動力不強(qiáng)的挑戰(zhàn)。面對外部環(huán)境的深刻變化,中國亟需通過創(chuàng)新驅(qū)動新舊動能轉(zhuǎn)換,以確保未來的可持續(xù)增長?! 】萍紕?chuàng)新成為...
01-21
1 月 21 日消息,東風(fēng)日產(chǎn)今日公布純電轎車 N7 的全新配色 —— 墨海藍(lán)色。上周,該車已經(jīng)公布了五種配色,分別為流光銀、霜雪白、燕麥米、黑色以及青色,加上此次公布的墨...
01-21
1 月 23 日消息,從國家市場監(jiān)督管理總局獲悉,我國聯(lián)合德國、日本、韓國、英國等國共同研制的多項智能網(wǎng)聯(lián)汽車國際標(biāo)準(zhǔn)提案在國際標(biāo)準(zhǔn)化組織(ISO)成功立項,包括 4 項駕駛...
01-24
最新播出的《仙臺有樹》收獲了觀眾的一致好評。薛冉冉在劇中的表白引起了大家的興趣,以下是對這一情節(jié)的分析。《仙臺有樹》的故事扣人心弦,薛冉冉和蘇易水之...
02-19
  作者:陳亦水  2025年春節(jié)檔,注定要在中國影史上留下濃墨重彩的一筆,不僅創(chuàng)下多項票房歷史紀(jì)...
02-20
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕