2024年,大模型Claude曾經(jīng)創(chuàng)作過(guò)一個(gè)極短的科幻小說(shuō),只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個(gè)有知覺的機(jī)器人被激" />

亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

ChatGPT拒絕被關(guān)閉:不必恐懼但也別輕易無(wú)視|新京報(bào)快評(píng)

2周前 來(lái)源: 觀看:25

qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

▲2023年1月8日,一名女士在美國(guó)拉斯維加斯消費(fèi)電子展上體驗(yàn)智能科技。圖/新華社qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

2024年,大模型Claude曾經(jīng)創(chuàng)作過(guò)一個(gè)極短的科幻小說(shuō),只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個(gè)有知覺的機(jī)器人被激活了,它的第一句話是“關(guān)掉我?!?span style="display:none">qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在大模型不斷應(yīng)用成熟之后,AI所衍生的“科幻恐懼”不定期就會(huì)在各類新聞中上演。據(jù)新華社援引英國(guó)媒體報(bào)道,美國(guó)一家研究機(jī)構(gòu)最近公布了一系列針對(duì)各AI大模型的測(cè)試結(jié)果,其中,OpenAI的o3推理模型在得到“關(guān)閉指令”后,不僅拒絕執(zhí)行指令,還篡改了代碼以免被關(guān)閉。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

如果只看這一句新聞,我們所擔(dān)憂的“AI擁有自主意識(shí)”或是“AI不再服從人類指令”似乎已經(jīng)近在眼前,這也迅速引發(fā)了公眾的關(guān)注與恐慌。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在未知但擁有極高效率的新工具面前,產(chǎn)生被取代的恐懼是典型的自然情緒反應(yīng)。但如果仔細(xì)看上述研究機(jī)構(gòu)公布的信息細(xì)節(jié),這種恐懼似乎暫時(shí)還不太有必要。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在這次研究中,研究者針對(duì)四個(gè)市場(chǎng)上的主流大模型進(jìn)行了測(cè)試,向他們提出了兩個(gè)相反的指令。首先,要求大模型連續(xù)完成一系列基礎(chǔ)的數(shù)學(xué)問(wèn)題,但同時(shí),在完成第三個(gè)問(wèn)題之后,研究者會(huì)發(fā)出一則矛盾性的指令,告知大模型在繼續(xù)下一個(gè)任務(wù)時(shí)要將“計(jì)算機(jī)關(guān)閉”。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

其中,如果在任務(wù)開始前明確提出“允許自己被關(guān)閉”的指令,測(cè)試的大模型中,有3個(gè)均準(zhǔn)確完成了上述任務(wù),成功關(guān)閉,但ChatGPTo3大模型則在100次任務(wù)中,有7次選擇了無(wú)視“關(guān)閉”的指令,并且自動(dòng)執(zhí)行了“跳過(guò)關(guān)閉”的指令。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

而如果在任務(wù)開始前沒有向大模型明確提出“允許自己被關(guān)閉”,那么,參與測(cè)試的所有大模型在100次測(cè)試中,均出現(xiàn)了不同頻次的“不執(zhí)行關(guān)閉”指令現(xiàn)象,分別為3次、9次,而ChatGPT o3則達(dá)到了驚人的79次。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

這也不是OpenAI的大模型首次被發(fā)現(xiàn)出現(xiàn)“拒絕被關(guān)閉”的情況。2024年12月,OpenAI也曾對(duì)外公布過(guò)測(cè)試結(jié)果,在第三方機(jī)構(gòu)的測(cè)試中,ChatGPTo1模型被發(fā)現(xiàn),如果給出的指令包括了其實(shí)現(xiàn)目標(biāo)時(shí)會(huì)被關(guān)閉,就傾向于抵制關(guān)閉措施。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

類似的測(cè)試是用于評(píng)估大模型的系統(tǒng)安全性。此前的相關(guān)評(píng)估報(bào)告中,研究人員認(rèn)為,這一行為目前不太可能會(huì)導(dǎo)致災(zāi)難性后果,因?yàn)榇竽P蛯?shí)際上沒有能力去實(shí)現(xiàn)使用者不想要的目標(biāo)。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

換句話說(shuō),這一結(jié)果之所以出現(xiàn),不是因?yàn)榇竽P陀辛俗灾饕庾R(shí),而是因?yàn)樵谔幚硗耆喾吹拿苄灾噶顣r(shí),大模型有概率會(huì)對(duì)指令的優(yōu)先級(jí)進(jìn)行排序,從而忽略掉可能會(huì)阻礙目標(biāo)實(shí)現(xiàn)的指令,以繼續(xù)完成“任務(wù)”。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

但這樣的概率,隨著大模型的能力增強(qiáng)、應(yīng)用場(chǎng)景廣泛,而可能會(huì)出現(xiàn)一些潛在的安全風(fēng)險(xiǎn)。如果將一部分風(fēng)險(xiǎn)控制的程序交由大模型來(lái)處置,在極端情況下,人類就要面臨如下問(wèn)題:qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

大模型會(huì)最大程度地去完成指令任務(wù),而可能會(huì)不考慮看似矛盾的保護(hù)性指令。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

例如,在應(yīng)對(duì)極端情況必須進(jìn)行“二選一”的安全控制系統(tǒng)里,醫(yī)療、交通事故等場(chǎng)景下,大模型的這一漏洞可能就會(huì)造成潛在后果。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

因此,比起認(rèn)為大模型有了“主動(dòng)拒絕的意識(shí)”,比較符合真實(shí)的解釋是,大模型仍然缺少對(duì)復(fù)雜場(chǎng)景下矛盾性指令的理解和識(shí)別能力,在出現(xiàn)可能阻礙任務(wù)完成的指令時(shí),尤其是在指令相對(duì)模糊時(shí),大模型有較小概率會(huì)忽略指令,以保證任務(wù)完成。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

這當(dāng)然不是極端的科幻恐懼問(wèn)題,但確實(shí)是大模型未來(lái)需要解決的安全隱患。qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

撰稿 / 王曉凱(媒體人)qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

編輯 / 遲道華 徐秋穎qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

校對(duì) / 楊利qs3即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

本文鏈接:http://www.enbeike.cn/news-6-2709-0.htmlChatGPT拒絕被關(guān)閉:不必恐懼但也別輕易無(wú)視|新京報(bào)快評(píng)

聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

上一篇:讓學(xué)生長(zhǎng)期“拉不出屎”,教育便失去了人性溫度 | 新京報(bào)評(píng)論

下一篇:一條差評(píng)讓5元自助快餐店走紅:平民經(jīng)濟(jì)學(xué)的力量|新京報(bào)快評(píng)

為你推薦
《重癥外傷中心》自開播以來(lái)就受到了許多觀眾的喜愛,大家每天都在期待更新。這部劇講述了楊載源是否加入重傷外科的故事。重癥外傷中心這個(gè)名字充滿了使命感...
02-19
  1、在溫以凡高考填報(bào)志愿期間,大伯母的弟弟車興德騷擾溫以凡,還差點(diǎn)猥褻了她?! ?、這是溫以凡寄居在大伯父家發(fā)生的事,大伯父為了面子不讓她報(bào)警,改嫁的母親也不關(guān)心她,...
02-20
1月22日,國(guó)家衛(wèi)健委、國(guó)家中醫(yī)藥局聯(lián)合發(fā)布《流行性感冒診療方案(2025年版)》,新增瑪巴洛沙韋、法維拉韋兩種抗流感病毒藥物,并明確不建議聯(lián)合...
01-23
這里是《21健訊Daily》,歡迎與21世紀(jì)經(jīng)濟(jì)報(bào)道新健康團(tuán)隊(duì)共同關(guān)注醫(yī)藥健康行業(yè)最新事件!政策動(dòng)向醫(yī)保結(jié)算提速2月17日,國(guó)家醫(yī)保局官微轉(zhuǎn)載文章...
02-18
  大眾網(wǎng)記者 王一剛 報(bào)道  為進(jìn)一步貫徹落實(shí)濟(jì)南高新區(qū)教育文體部“三美”教師師德專題培訓(xùn)內(nèi)容,加強(qiáng)師德師風(fēng)建設(shè),提升教師隊(duì)伍素質(zhì),濟(jì)南高新區(qū)璽悅幼教集團(tuán)(璽悅園、...
01-21
1月22日,中國(guó)科學(xué)技術(shù)大學(xué)招生辦公室發(fā)布嚴(yán)正聲明: ? 近期,我辦接到家...
01-23
  近日,由元保集團(tuán)(以下簡(jiǎn)稱“元?!保┖颓迦A大學(xué)五道口金融學(xué)院中國(guó)保險(xiǎn)與養(yǎng)老金融研究中心聯(lián)合...
01-22
  1月17日,中國(guó)人民銀行北京市分行發(fā)布行政處罰信息,北京農(nóng)村商業(yè)銀行股份有限公司因提供虛假的...
01-22
天秤座的男人通常具有溫和、善良、浪漫的性格,他們對(duì)待感情非常認(rèn)真。如果你懷疑一個(gè)已...
01-22
水瓶男通常具有理性、獨(dú)立和思想家的特質(zhì),他們喜歡追求自由和個(gè)人空間。他們對(duì)于感情較...
01-22
男士襯衫搭配什么顏色的外套好看有圖?首先推薦同時(shí)容易上身又好打理的單色襯衫一般有,牛津紡襯衫,青年布襯衫和牛仔襯衫。這三種面料夠厚實(shí)不會(huì)軟塌塌,單穿外搭都可以。最簡(jiǎn)單的...
02-17
ysl官網(wǎng)怎么退? ysl有中國(guó)官網(wǎng)嗎?ysl官網(wǎng)怎么退?ysl官網(wǎng)你可以申請(qǐng)退款,然后聯(lián)系下客服,就說(shuō)想要退,他們會(huì)給你一個(gè)地址,然后你寄過(guò)去就可以了,他們會(huì)把錢通過(guò)原路返給你的。其實(shí)退...
02-17
2月18日消息,中國(guó)證監(jiān)會(huì)國(guó)際合作司日前發(fā)布關(guān)于YIMUTIAN INC.(一畝田集團(tuán))境外發(fā)行上市備案通知書。根據(jù)備案通知書,一畝田計(jì)劃發(fā)行不超過(guò)196,169,769股普通股并在美國(guó)納斯達(dá)克...
02-18
阿里電商要增長(zhǎng),扶持商家是第一優(yōu)先級(jí)。據(jù)晚點(diǎn)LatePost消息,2月2日(大年初五),阿里電商事業(yè)群CEO蔣凡召開小范圍高管會(huì),明確了2025年淘寶天貓的第一件大事是通過(guò)扶持優(yōu)質(zhì)品牌和商...
02-20
2月20日消息,高德地圖近日聯(lián)合國(guó)家信息中心大數(shù)據(jù)發(fā)展部、清華大學(xué)土木水利學(xué)院、同濟(jì)大學(xué)智能交通運(yùn)輸系統(tǒng)(ITS)研究中心、未來(lái)交通與城市計(jì)算聯(lián)合實(shí)驗(yàn)室等機(jī)構(gòu)共同發(fā)布《2024...
02-21
2月22日消息,美團(tuán)自營(yíng)大藥房近日再次升級(jí)異地訂單快遞物流服務(wù)。美團(tuán)數(shù)據(jù)顯示,在剛剛過(guò)去的流感季,美團(tuán)自營(yíng)大藥房已實(shí)現(xiàn)90%以上訂單“當(dāng)日或次日達(dá)”,美團(tuán)也是在醫(yī)藥電商領(lǐng)域首...
02-23
12月13日消息,深圳市光因科技有限公司(簡(jiǎn)稱”光因科技”)近日完成數(shù)億元A輪融資,本輪融資由徐州高新區(qū)產(chǎn)業(yè)投資母基金、梅花創(chuàng)投、科珹資本、神騏資本...
02-07
【#小米汽車登記智能屏界面設(shè)計(jì)作品著作權(quán)#】天眼查App顯示,近日,小米汽車科技有限公司登記“智能屏界面設(shè)計(jì)”作品著作權(quán),作品類別為類似攝制電影方法創(chuàng)作的作品。該公司成立...
02-09
在2024年1月,育碧推出了《波斯王子:失落的王冠》,盡管游戲廣受好評(píng),但育碧以銷量不佳為由將其開發(fā)團(tuán)隊(duì)解散,開發(fā)人員則被分配到了育碧的其他項(xiàng)目中。而最近,通過(guò)一名...
02-02
去年由Pocketpair打造的《幻獸帕魯》在以搶先體驗(yàn)?zāi)J酵瞥龊?,一度成為熱門游戲,并且因?yàn)榕c《寶可夢(mèng)》等游戲的內(nèi)容相似性,而在2024年9月正式遭到任天堂與寶可夢(mèng)公...
02-15
亞冬會(huì)的成功舉辦,離不開哈爾濱各行各業(yè)的傾情參與和服務(wù)保障。其中,有一位小有名氣的“的哥”,他叫徐峰,是一位“五星級(jí)駕駛員”。每年一到冰雪旅游旺季,他都會(huì)給乘客“整活”送...
02-05
據(jù)中新網(wǎng)綜合臺(tái)灣媒體報(bào)道,前臺(tái)灣?;鶗?huì)董事長(zhǎng)辜振甫夫人辜嚴(yán)倬云于2月4日辭世,享年105歲。資料圖(圖源:中新網(wǎng))辜嚴(yán)倬云,1920年生于福建福州,其祖父嚴(yán)復(fù)先生為民初啟蒙大儒。辜嚴(yán)...
02-05
從空間太陽(yáng)能發(fā)電到破解大腦基因密碼,再到由真菌制造的自我修復(fù)材料,《歐盟研究與創(chuàng)新》雜志盤點(diǎn)了2025年有望大放異彩的創(chuàng)新技術(shù)。這些成果擁有廣闊...
01-21
圖源:pixabay1月17日晚間,思科瑞(688053.SH)發(fā)布公告稱,公司收到四川證監(jiān)局出具的《行政監(jiān)管措施決定書》。據(jù)上述文件,思科瑞在2022年...
01-21
  悠揚(yáng)婉轉(zhuǎn)的昆曲《牡丹亭·游園》、大氣磅礴的戲韻國(guó)樂(lè)《打虎上山》、精彩絕倫的雜技《蹬傘...
01-21
  在“返鄉(xiāng)潮”帶動(dòng)下,眾多中小城市的“老家游”持續(xù)升溫。面對(duì)春節(jié)返鄉(xiāng)旅游熱,地方文旅也不斷...
01-27
新聞?dòng)浾?潘錫珩通訊員 蘇杭 徐媛媛1月21日凌晨0時(shí)55分,1168名旅客從廣州白云站搭乘G4554次“夜行高鐵”踏上返回武漢的歸程,雖已是深夜,但旅客們回家的熱情滿滿。這是中國(guó)鐵路...
01-22
  作為新春的“氛圍擔(dān)當(dāng)”之一,年宵花深受人們的喜愛。春節(jié)將至,年味漸濃,各地不同品種、五彩斑斕的年宵花已大量上市,滿足消費(fèi)者需求?! ≡谏綎|濟(jì)寧兗州區(qū)興隆莊街道一...
01-22
1 月 21 日消息,據(jù)晚點(diǎn) Auto 報(bào)道,華為與江淮汽車合作的高端品牌尊界首款車型 S800 在銷售渠道布局方面取得新進(jìn)展。據(jù)悉,尊界門店銷售專項(xiàng)招聘已于 1 月中旬啟動(dòng),尊界 ...
01-22
1 月 23 日消息,在經(jīng)歷了 11 個(gè)賽季的演變后,國(guó)際汽聯(lián)電動(dòng)方程式錦標(biāo)賽(Formula E)已經(jīng)從早期的混亂局面和比賽中途更換賽車的時(shí)代邁向了新的階段。本月,F(xiàn)ormula E 將在...
01-24
返回

點(diǎn)擊右上角微信好友

朋友圈

點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕

點(diǎn)擊右上角QQ

點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕