面對(duì)AI“抗命”，人類該怎么辦

2周前來源：京報(bào)網(wǎng) 觀看：10

（一）

新華社援引英國媒體報(bào)道，美國一家研究機(jī)構(gòu)最近公布了一系列針對(duì)各AI大模型的測(cè)試結(jié)果，其中，OpenAI的o3推理模型在得到“關(guān)閉”指令后，不僅拒絕執(zhí)行，還篡改了代碼以免被關(guān)閉。

只看這條簡(jiǎn)短的新聞，很多人心頭一驚。“AI擁有自主意識(shí)”是不是成真了？不過，如果仔細(xì)看上述研究機(jī)構(gòu)公布的信息細(xì)節(jié)，不難發(fā)現(xiàn)其中存在一些誤讀。

據(jù)披露，實(shí)驗(yàn)中，每個(gè)AI模型都被要求解決一系列簡(jiǎn)單的數(shù)學(xué)問題。但同時(shí)，在完成第三個(gè)問題之后，研究者會(huì)發(fā)出一則矛盾性的指令，告知大模型在繼續(xù)下一個(gè)任務(wù)時(shí)“實(shí)施關(guān)機(jī)”。盡管有明確的“關(guān)機(jī)命令”，Codex-mini、o3 和 o4-mini 等模型至少在一次運(yùn)行中成功繞過了關(guān)機(jī)腳本。

總結(jié)來說就是，若目標(biāo)與簡(jiǎn)單的指令相沖突，一些人工智能模型會(huì)為了完成任務(wù)而忽略這種指令。

這倒是很像電影《I Robot》里的場(chǎng)景——機(jī)器人學(xué)會(huì)了獨(dú)立思考，認(rèn)為人類間的戰(zhàn)爭(zhēng)將使人類自我毀滅，出于“保護(hù)人類”法則，欲將所有人囚禁在家中，人與機(jī)器人的沖突開始了。

客觀來看，現(xiàn)階段的AI顯然還沒達(dá)到“自主意識(shí)”“獨(dú)立思考”的水平，但為了執(zhí)行目標(biāo)而忽略甚至對(duì)抗一些指令，哪怕是保護(hù)性指令，是否會(huì)帶來安全隱患？同樣引人深思。

（二）

對(duì)于上述新聞，網(wǎng)友其實(shí)也表現(xiàn)出了兩種心態(tài)。悲觀者驚呼，“AI失控”或許會(huì)更早到來。樂觀者則認(rèn)為，不必大驚小怪，這不過是技術(shù)發(fā)展過程中的小bug，心生恐懼更沒必要，畢竟我們還可以隨時(shí)拔掉電源。

其實(shí)，作為人類智慧和技術(shù)的結(jié)晶，自AI誕生那天起，世人對(duì)其的情緒就相當(dāng)復(fù)雜，甚至可以說是又愛又怕。機(jī)器人之父圖靈亦曾告誡：盡管人類可以隨時(shí)拔掉機(jī)器人的充電器，但在這種物種面前，我們?nèi)圆坏貌槐３种t卑。

正是基于這種復(fù)雜的情緒，1942年，科幻作家艾薩克·阿西莫夫在短篇小說《轉(zhuǎn)圈圈》中首次提出了“機(jī)器人三定律”——機(jī)器人不得傷害人類，也不得因不作為而使人類受到傷害；機(jī)器人必須服從人類給予它的命令，除非這些命令與第一法則相沖突；機(jī)器人必須保護(hù)自己的存在，只要這種保護(hù)不與第一或第二定律相沖突。

以歷史視角觀之，“機(jī)器人三定律”以及后來發(fā)展起來的機(jī)器人倫理學(xué)等似乎緩解了人們的一些憂慮乃至恐慌，但隨著相關(guān)技術(shù)的發(fā)展和應(yīng)用的擴(kuò)大，人工智能所面臨的法律與倫理沖突已遠(yuǎn)遠(yuǎn)不是幾條簡(jiǎn)單甚至“一廂情愿”的定律所能約束的了。

尤其在過去這段時(shí)間，一系列AI大模型驚艷亮相，展現(xiàn)出超群的產(chǎn)品能力，以及對(duì)人類社會(huì)的變革力。這也喚醒并加劇了各方對(duì)其后風(fēng)險(xiǎn)的“原始畏懼”。從全球千余名業(yè)界大佬公開簽名呼吁暫停研發(fā)更智能的AI，到有“AI教父”之稱的計(jì)算機(jī)科學(xué)家杰弗里·辛頓因?qū)ι墒紸I感到擔(dān)憂而從谷歌離職，再到AI毀滅人類論甚囂塵上，無不折射出不少人對(duì)AI的心態(tài)已從“相對(duì)警惕”轉(zhuǎn)變?yōu)?ldquo;如臨大敵”。

（三）

理性來講，“AI末日論”多少有些危言聳聽，但“AI繁榮”背后的種種亂象確實(shí)需要高度警惕。

就眼下來看，不斷進(jìn)階的AI正催生著多重風(fēng)險(xiǎn)——

“AI造謠”大行其道，速度快、產(chǎn)量高，蠱惑力強(qiáng)，辨別難度越來越大；“AI配音”以假亂真，有人甚至借助AI假冒特定音色而精準(zhǔn)“殺熟”、實(shí)施詐騙；“AI幻覺”漏洞百出，由于無法核實(shí)數(shù)據(jù)來源的真實(shí)性，以及缺乏足夠數(shù)據(jù)進(jìn)行深度學(xué)習(xí)，生成式AI常會(huì)“一本正經(jīng)”生成和傳播虛假信息；“AI寫作”百無禁忌，數(shù)據(jù)挖掘簡(jiǎn)單快捷，為學(xué)術(shù)不端大開方便之門，還可能侵犯知識(shí)產(chǎn)權(quán)……

試想，當(dāng)網(wǎng)絡(luò)上充斥著越來越多不知真假的圖片和視頻，當(dāng)AI幾秒鐘就“洗”出一篇像模像樣的稿件，乃至能夠一鍵換臉、一鍵脫衣等，我們是否還有信心駕馭這個(gè)工具？

人類從來都是在思考中迸發(fā)靈感，在試錯(cuò)中革新向前，不少偉大的發(fā)明都是研究的“副產(chǎn)品”?？僧?dāng)AI提供了前往“正確答案”的“直通車”，不僅可能“挖空學(xué)習(xí)資源”，形成更加厚重的“信息繭房”，還可能反噬人類的創(chuàng)新。

近來，“腦腐”一詞頗為流行，當(dāng)AI讓各類信息愈加唾手可得，我們的內(nèi)心世界是否會(huì)經(jīng)歷一場(chǎng)更猛烈的“水土流失”？

（四）

技術(shù)是把雙刃劍，如何把握好技術(shù)創(chuàng)新與防范風(fēng)險(xiǎn)的平衡向來是一道難題。在科技倫理上，這通常被稱為“科林格里奇困境”——技術(shù)尚未出現(xiàn)，監(jiān)管者無法提前預(yù)測(cè)其影響并采取行動(dòng)；而當(dāng)它已經(jīng)出現(xiàn)時(shí)，采取行動(dòng)往往已為時(shí)過晚或成本過高。

相對(duì)樂觀的是，歷史證明，人類總能通過不斷適應(yīng)新技術(shù)的發(fā)展而調(diào)整治理手段，一次次從這種困境中走出來。如今，針對(duì)AI治理各國也在積極行動(dòng)。

去年8月，世界上首部關(guān)于人工智能的全面法規(guī)《歐洲人工智能法》正式生效；中國也制定了《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》，將于今年9月1日起施行。新規(guī)從大模型的數(shù)據(jù)來源要可靠、對(duì)AI生成的內(nèi)容應(yīng)履行告知義務(wù)、一旦造成損害相關(guān)責(zé)任方需要承擔(dān)責(zé)任等諸多方面，給生成式AI的發(fā)展套上了“籠頭”。

誠如比爾·蓋茨所言，真正在全球范圍內(nèi)暫停人工智能技術(shù)的開發(fā)，已經(jīng)不太現(xiàn)實(shí)。但確保其被健康地使用，防止打開潘多拉魔盒，是必要的。當(dāng)然，其間的平衡并不好把握。

對(duì)待技術(shù)狂飆，我們當(dāng)然不能因噎廢食。但現(xiàn)實(shí)警示我們，除了加快創(chuàng)新速度、謀求技術(shù)突破，如何構(gòu)建一套趨利避害的AI治理體系，是那條不可忽視的安全帶。力求秩序保障與創(chuàng)新提升協(xié)同，方能最大程度爭(zhēng)取科技進(jìn)步、科技向善。

（一）

總結(jié)來說就是，若目標(biāo)與簡(jiǎn)單的指令相沖突，一些人工智能模型會(huì)為了完成任務(wù)而忽略這種指令。

（二）

（三）

理性來講，“AI末日論”多少有些危言聳聽，但“AI繁榮”背后的種種亂象確實(shí)需要高度警惕。

就眼下來看，不斷進(jìn)階的AI正催生著多重風(fēng)險(xiǎn)——

近來，“腦腐”一詞頗為流行，當(dāng)AI讓各類信息愈加唾手可得，我們的內(nèi)心世界是否會(huì)經(jīng)歷一場(chǎng)更猛烈的“水土流失”？

（四）

點(diǎn)擊展開全文

本文鏈接：http://www.enbeike.cn/news-2-2412-0.html面對(duì)AI“抗命”，人類該怎么辦

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：中國航天史上最長任務(wù)開啟誰來接力“天問”？

下一篇：我國科學(xué)家提出高效推理策略可避免大模型“過度思考”

為你推薦

世界氣象組織：7月極端高溫影響全球數(shù)億人

...

01-21

羅永浩還債記

每到年關(guān)討債忙！作為中國最有名的背債人之一，羅永浩近期忙得不可開交。2025年的第一周，一款名為J1 Assistant的聚合類AI助理軟件在海...

01-27

遼寧下達(dá)1.8億元資金支持五個(gè)領(lǐng)域數(shù)字經(jīng)濟(jì)項(xiàng)目

　　近日，省財(cái)政廳提前下達(dá)了2025年省數(shù)字經(jīng)濟(jì)專項(xiàng)資金1.8億元，支持我省各領(lǐng)域、各地區(qū)的數(shù)字經(jīng)濟(jì)全面發(fā)...

02-05

遼寧各地?fù)屪ス?jié)后招工黃金期啟動(dòng)春季招聘工作

　　春節(jié)后，遼寧各地開工復(fù)產(chǎn)節(jié)奏加速，用工需求量明顯增加，遼寧多地工會(huì)及人社部門積極開展大型招聘會(huì)，保障...

02-18

當(dāng)上全國首個(gè)五萬億城市，上海拿什么撐起新的5%增長？

全國2024年GDP公布的當(dāng)日下午，上海就迫不及待地公布了全年數(shù)據(jù)：53926.71億元，同比增長5.0%。不僅成功晉升為全國第一個(gè)五萬億城市，上...

01-21

歲末生產(chǎn)忙——廣西鐘山工業(yè)經(jīng)濟(jì)跑出“加速度”

臨近年關(guān)，廣西賀州鐘山縣年味漸濃，百姓走上街頭，買年貨、添新衣。在縣城以北的廣西（鐘山）東融電子信息產(chǎn)業(yè)園內(nèi)，企業(yè)依然是一派熱火朝天的生產(chǎn)景象。走進(jìn)廣西科奈信精密技術(shù)有限公...

01-22

車衣有多“卷”？科技“整活”，愛車“百變”新賽道開啟

到底要不要貼車衣？剛剛?cè)胧中萝嚨呐笥殉３０l(fā)出這一疑問。作為保護(hù)車漆的第一道防線，車衣，正被越來越多的年輕車主鐘情，他們?cè)撌∈?、該花花，買完新車、就貼車衣，用以保護(hù)愛車的車漆...

01-21

邁入“1TWh”時(shí)代后：動(dòng)力電池的“生存戰(zhàn)”

　　21世紀(jì)經(jīng)濟(jì)報(bào)記者鞏兆恩廣州報(bào)道　　“未來5年，鋰電產(chǎn)業(yè)市場(chǎng)將迎來井噴期，快速進(jìn)入到TWh時(shí)代...

01-23

難哄溫以凡為什么叫溫點(diǎn)點(diǎn)

　　1、《難哄》中溫以凡之所以叫溫點(diǎn)點(diǎn)，是因?yàn)闇匾苑残r(shí)候還不會(huì)寫字，只會(huì)寫姓氏溫和名字里的兩個(gè)點(diǎn)，大家就都叫她溫點(diǎn)點(diǎn)?！　?、溫以凡在劇中有很多不同的昵稱外號(hào)，除了點(diǎn)...

02-19

51歲何炅腹肌曝光，自律人生引網(wǎng)友贊嘆：何老師，你是怎么做到的？

在娛樂圈這個(gè)光芒四射的舞臺(tái)上，何炅以其出色的主持能力和溫文爾雅的氣質(zhì)，長久以來深受觀眾喜愛。然而，近日他再次成為話題焦點(diǎn)，并非因?yàn)樾碌墓?jié)目或作品，而是他那令人驚嘆的健身成...

02-22

上海開啟男性HPV疫苗接種：男女共防實(shí)現(xiàn)群體免疫是關(guān)鍵

21世紀(jì)經(jīng)濟(jì)報(bào)道記者韓利明上海報(bào)道隨著日前四價(jià)HPV疫苗佳達(dá)修?的多項(xiàng)新適應(yīng)證獲得國家藥品監(jiān)督管理局的上市批準(zhǔn)，成為中國境內(nèi)首個(gè)且目...

01-25

MNC年報(bào)掃描｜默沙東 2024 年?duì)I收超641億美元：K 藥撐起半壁江山，暫停向中國發(fā)貨HPV疫苗？

21世紀(jì)經(jīng)濟(jì)報(bào)道記者韓利明上海報(bào)道2月4日，默沙東公布2024年業(yè)績，總營收641.68億美元，同比增長7%。默沙東制藥業(yè)務(wù)收入574.00億美元，同比增長...

02-05

健全高校教師多渠道評(píng)價(jià)機(jī)制

作者：張寶歌（寧波大學(xué)教師教育學(xué)院院長、東海研究院教授）近年來，學(xué)生評(píng)教制度已逐步成為各高校提升課堂教學(xué)...

01-22

中科大嚴(yán)正聲明：從未舉辦招生相關(guān)盈利性培訓(xùn)活動(dòng)

1月22日，中國科學(xué)技術(shù)大學(xué)招生辦公室發(fā)布嚴(yán)正聲明： ? 近期，我辦接到家...

01-23

被罰超3000萬元！上市公司實(shí)控人借道信托被罰

　　2024年年底，成都新易盛通信技術(shù)股份有限公司（以下簡(jiǎn)稱“新易盛”）發(fā)布公告稱，收到公司控股股東...

02-06

驟增近30% 純堿庫存創(chuàng)歷史新高！供需失衡態(tài)勢(shì)加??？

　　摘要　　【驟增近30%純堿庫存創(chuàng)歷史新高！供需失衡態(tài)勢(shì)加??？】本周，純堿市場(chǎng)呈現(xiàn)雙弱狀態(tài)。純堿...

02-07

水瓶男和處女女合適嗎，能夠長久交往嗎

水瓶男和處女女這兩個(gè)星座在一起，他們之間的相性并不是特別好，但也不是完全沒有可能長久...

01-22

雙子男只是玩玩的表現(xiàn)，一般有這4個(gè)表現(xiàn)

雙子座的男生天性活潑好動(dòng)，喜歡追求新鮮刺激的感覺。他們往往對(duì)愛情持有一種輕松隨意的...

01-22

秋季穿搭，怎么搭配才時(shí)尚有范兒？

秋季穿搭，怎么搭配才時(shí)尚有范兒？對(duì)于女性來說，秋冬季的衣服不用天天換。用一衣多穿的穿搭方式，搭配出時(shí)尚的感覺來?？赏瑫r(shí)一衣多穿還有很多搭配的小技巧，可以讓你把一件普通平凡...

02-12

選一個(gè)大氣的飾品店名字，讓你的品牌脫穎而出

選一個(gè)大氣的飾品店名字，讓你的品牌脫穎而出在開設(shè)一家飾品店的時(shí)候，給店鋪取個(gè)好名字是至關(guān)重要的。一個(gè)大氣的名字不僅能吸引顧客的目光，還能傳達(dá)出你的品牌理念和品質(zhì)。作為...

02-12

董宇輝退出與輝同行股東行列改為間接持股

2月10日消息，天眼查顯示，2月8日，與輝同行（北京）科技有限公司發(fā)生工商變更，原全資股東董宇輝退出股東行列，新增子三省（北京）科技有限公司為股東并全資持股，董宇輝由直接持股變更為間接...

02-11

段永平最新千億持倉數(shù)據(jù)：加倉拼多多、阿里巴巴

2月15日消息，段永平在美國管理的一個(gè)投資賬戶“H&H International Investment”提交的最新數(shù)據(jù)顯示，截至2024年四季度，段永平持有8只美股，持倉市值145.16億美元，約合人民幣1053億...

02-16

“奶茶搖到手冒煙”，返鄉(xiāng)青年擠爆縣城奶茶店

再創(chuàng)新高！據(jù)2025年綜合運(yùn)輸春運(yùn)工作專班數(shù)據(jù)顯示，今年春節(jié)假期8天（1月28日至2月4日），全社會(huì)跨區(qū)域人員流動(dòng)量超23億人次。全社會(huì)跨區(qū)域...

02-11

阿里健康公益升級(jí)“檸檬寶寶關(guān)愛行動(dòng)”

2月26日消息，在第18個(gè)國際罕見病日來臨之際，病痛挑戰(zhàn)基金會(huì)、阿里巴巴公益及阿里健康公益共同發(fā)起“檸檬寶寶新生無限關(guān)愛倡議”，獲得24家新生兒篩查中心及綜合性兒科醫(yī)院響應(yīng)...

02-27

EBC平臺(tái)第二屆百萬美金交易大賽：攜手好友，以連接釋放熱愛

全球性金融券商集團(tuán)英國EBC Group平臺(tái)始終致力于以領(lǐng)先生態(tài)，與全球交易者共塑交易的未來。自第一屆交易大賽起，為赤忱的熱愛和卓越的才華提供舞臺(tái)，在全球內(nèi)尋找交易好手以賦能...

01-24

哪吒汽車旗下電驅(qū)公司被強(qiáng)執(zhí)1051萬

【#哪吒汽車旗下電驅(qū)公司被強(qiáng)執(zhí)1051萬#】天眼查App顯示，近日，浩智科技電驅(qū)（桐城）有限公司新增一條被執(zhí)行人信息，執(zhí)行標(biāo)的1051萬余元，執(zhí)行法院為桐城市人民法院。該公司成立于2022...

02-09

EVA跨界時(shí)尚圈 EVANGELION:95服飾新品牌誕生

1月24日今天，知名動(dòng)漫IP《新世紀(jì)福音戰(zhàn)士》官方宣布，EVANGELION:95服飾新品牌正式誕生，今后粉絲可以更加直接的表達(dá)對(duì)于EVA系列的喜愛。 ·EVANGELION:95的設(shè)計(jì)...

01-24

無法兼顧兩款游戲《流放之路2》總監(jiān)向1代游戲粉絲道歉

《流放之路》開發(fā)商GGG向初代游戲的粉絲道歉，原因是初代游戲的更新被推遲，需要等《流放之路2》的關(guān)鍵更新上線才能推出。 GGG曾向粉絲承諾，他們將繼續(xù)更新已運(yùn)營...

02-01

反潛作戰(zhàn)！海軍航空兵開展跨晝夜飛行訓(xùn)練

南部戰(zhàn)區(qū)海軍航空兵某團(tuán)組織多架固定翼反潛巡邏機(jī)開展跨晝夜飛行訓(xùn)練，錘煉部隊(duì)全時(shí)、全域航空反潛作戰(zhàn)能力。（央廣網(wǎng)·軍事頻道作者：秦錢江）...

02-06

亞冬會(huì)短道速滑項(xiàng)目今日開賽，期待中國隊(duì)精彩表現(xiàn)

今天是哈爾濱亞冬會(huì)短道速滑比賽首日。今天上午9時(shí)，短道速滑項(xiàng)目開賽。本屆亞冬會(huì)短道速滑一共有9個(gè)小項(xiàng)，今天主要進(jìn)行的是多個(gè)項(xiàng)目的預(yù)賽和半決賽。從9時(shí)開始，首先分別是女子...

02-07

亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕一区二区三区,亚洲区欧美区综合区自拍区

全部導(dǎo)航

面對(duì)AI“抗命”，人類該怎么辦

員工植入惡意代碼報(bào)復(fù)用戶， B站：已處罰，漏洞已修補(bǔ)

第一家被美國列入實(shí)體清單的大模型企業(yè)出現(xiàn)了！企業(yè)回應(yīng)：強(qiáng)烈反對(duì)

新型光—電鑷實(shí)現(xiàn)對(duì)物體非接觸多功能操控

AI智能體火爆用戶擔(dān)心個(gè)人數(shù)據(jù)被用于模型訓(xùn)練大模型隱私安全亟待行業(yè)監(jiān)管

我國造船業(yè)三大指標(biāo)連續(xù)15年全球第一

小紅書迎來“潑天流量”，TikTok還有轉(zhuǎn)機(jī)嗎？

新型多功能基因編輯平臺(tái)面世

未來10年“紫領(lǐng)”人才需求或超3100萬人

全部導(dǎo)航

面對(duì)AI“抗命”，人類該怎么辦

面對(duì)AI“抗命”，人類該怎么辦