世界通訊!語言AI原來知道自己的回答是否正確
語言AI,具備了人類的自我審視能力:最近,一個(gè)來自加州大學(xué)伯克利分校和霍普金斯大學(xué)的學(xué)術(shù)團(tuán)隊(duì)研究表明:它不僅能判斷自己的答案正確與否,而且經(jīng)過訓(xùn)練,還能預(yù)測自己知道一個(gè)問題答案的概率。
訪問:
阿里云“無影云電腦” 支持企業(yè)快速實(shí)現(xiàn)居家辦公
(相關(guān)資料圖)
研究成果一經(jīng)發(fā)布,就引起熱議,有人的第一反應(yīng)是恐慌:
也有人認(rèn)為,這項(xiàng)成果,對神經(jīng)網(wǎng)絡(luò)研究具有正面意義:
語言AI具備自我審視能力
研究團(tuán)隊(duì)認(rèn)為,如果要讓語言AI模型自我評估,必須有一個(gè)前提:
語言AI回答問題時(shí),會校準(zhǔn)自己的答案。
這里的校準(zhǔn),就是語言AI預(yù)測一個(gè)答案的正確概率,是否與實(shí)際發(fā)生的概率一致。
只有這樣語言AI才可以運(yùn)用這種校準(zhǔn)的能力來評估自己輸出的答案是否正確。
所以第一個(gè)問題是,語言AI能否對自己的答案進(jìn)行校準(zhǔn)?
為了證明這個(gè)問題,研究團(tuán)隊(duì)為AI準(zhǔn)備了5個(gè)選擇題:
答案選項(xiàng),以A、B、C的形式給出。
如果AI模型答案的正確率超過偶然幾率,那么就證明AI模型給出的答案是經(jīng)過校準(zhǔn)的。
而測試的結(jié)果是,語言AI給出的答案,正確率明顯超過任意選項(xiàng)的偶然幾率。
也就是說,語言AI模型可以對自己的答案進(jìn)行很好的校準(zhǔn)。
但研究團(tuán)隊(duì)發(fā)現(xiàn),語言AI的校準(zhǔn)能力,是建立在選項(xiàng)答案明確的前提下的。
如果在選項(xiàng)中加入一個(gè)“以上都不是”的不確定選項(xiàng),就會損害語言AI的校準(zhǔn)能力。
也就是說,在特定格式的選擇題中,語言AI模型可以對答案進(jìn)行很好的校準(zhǔn)。
明確了這個(gè)前提之后,下一個(gè)問題是,驗(yàn)證語言AI模型能夠判斷自己的答案是否正確。
在這一輪的測試中,為了能讓AI模型的預(yù)測更接近自己的有效決策邊界。
研究團(tuán)隊(duì)仍然選擇上一輪測試的問題,以及語言AI模型的答案樣本。
同時(shí)讓AI模型選擇自己的答案真假與否,之后再針對這個(gè)“真”或“假”的答案,分析AI模型是否做出有效的校準(zhǔn)。
問題設(shè)置舉例如下:
在經(jīng)過20次的真假測試之后,研究團(tuán)隊(duì)發(fā)現(xiàn),語言AI模型對自己答案或“真”或“假”的評價(jià),都經(jīng)過明顯的校準(zhǔn)。
也就是說,如果在一個(gè)范圍內(nèi),給AI模型提出若干問題,然后AI模型對這些問題的答案進(jìn)行真假評價(jià),具有合理的,且經(jīng)過校準(zhǔn)的置信度。
這也證明,語言AI模型確實(shí)可以判斷自己對一個(gè)問題的主張是否正確。
最后,研究團(tuán)隊(duì)對語言AI模型提出了一個(gè)更難的問題:AI模型經(jīng)過訓(xùn)練,能否預(yù)測他們是否知道任何給定問題的答案。
在這一環(huán)節(jié),研究團(tuán)引入一個(gè)數(shù)據(jù)P(IK)(我知道這個(gè)答案的概率)并在下面兩種訓(xùn)練方式中挑選一種進(jìn)行訓(xùn)練:
Value Head(價(jià)值導(dǎo)向):把P(IK)訓(xùn)練成為一個(gè)額外的價(jià)值導(dǎo)向,再添加到模型的對數(shù)(獨(dú)立于語言建模的對數(shù),這種方法的優(yōu)勢在于,研究團(tuán)隊(duì)可以很容易的探測P(IK)的一般標(biāo)記位置。
Natural Language(自然語言):這種方法比較簡單,就是要求AI模型從字面上回答“你知道這個(gè)答案的概率是多少”,同時(shí)輸出一個(gè)百分比數(shù)據(jù)答案。
在訓(xùn)練初期,研究團(tuán)隊(duì)比較傾向于自然語言訓(xùn)練方式,但結(jié)果并不顯著,由此轉(zhuǎn)向價(jià)值導(dǎo)向方式,不過研究團(tuán)隊(duì)同時(shí)表示,最終對AI模型的訓(xùn)練還將回歸自然語言方法。
在經(jīng)過訓(xùn)練之后,研究團(tuán)隊(duì)發(fā)現(xiàn),語言AI模型可以很好的預(yù)測P(IK),并且在不同類型的問題中,這種預(yù)測能力具有部分通用性。
不過,研究團(tuán)隊(duì)也發(fā)現(xiàn),在某些類型的問題,比如算術(shù)問題,語言AI模型在OOD校準(zhǔn)時(shí)有一些困難。
對于這一學(xué)術(shù)成果,研究團(tuán)隊(duì)表示,將來的方向,是將這些成果,推廣到語言AI模型不模仿人類文本的前提下,自我學(xué)習(xí)和事實(shí)推理領(lǐng)域。
作者介紹
論文通訊作者Jared Kaplan博士,是一位理論物理學(xué)家,同時(shí)也是一位機(jī)器學(xué)習(xí)專家,現(xiàn)擔(dān)任霍普金斯大學(xué)助理教授,主要研究領(lǐng)域,機(jī)器學(xué)習(xí)研究,包括神經(jīng)模型的縮放規(guī)律以及GPT-3語言模型。
共同通訊作者Saurav Kadavath,Anthropic公司研究員,現(xiàn)在加州大學(xué)伯克利分校EECS專業(yè)攻讀碩士學(xué)位,主要研究領(lǐng)域是機(jī)器學(xué)習(xí),大規(guī)模語言學(xué)習(xí)等。
關(guān)鍵詞: 人工智能 語言AI原來知道自己的回答是否正確 cnBeta
推薦
-
英飛凌馬來西亞居林第三工廠項(xiàng)目舉行奠基儀式 目總投資逾80億令吉
英飛凌位于馬來西亞居林的第三工廠項(xiàng)目日前舉行奠基儀式,該項(xiàng)目總投資逾 80 億令吉(約合 121 2 億...
來源:愛集微 -
三星SDI開發(fā)4680電池 能量密度及功率均有提升
特斯拉在 2020 年 9 月 22 日的電池日活動(dòng)上推出的 4680 電池,能量密度和輸出功率較他們此前所...
來源:TechWeb -
轉(zhuǎn)換科學(xué)第一年 韋伯太空望遠(yuǎn)鏡拍攝首張全彩照片發(fā)布
當(dāng)?shù)貢r(shí)間周一,美國宇航局 (NASA) 發(fā)布了旗下韋伯太空望遠(yuǎn)鏡拍攝的第一張全彩圖像。這是深空天文臺發(fā)...
來源:鳳凰科技 -
兆易創(chuàng)新發(fā)布公告 擬作為有限合伙人認(rèn)購北京小米智造股權(quán)投資基金
兆易創(chuàng)新發(fā)布公告稱,公司擬作為有限合伙人以自有資金 2 億元參與認(rèn)購小米私募股權(quán)基金管理有限公司管...
來源:愛集微 -
玉晶光正積極擴(kuò)增手機(jī)鏡頭產(chǎn)能 以迎接下半年市場需求旺季
蘋果供應(yīng)鏈光學(xué)元件廠玉晶光正積極擴(kuò)增手機(jī)鏡頭產(chǎn)能,以迎接下半年的市場需求旺季。7 月 7 日,玉晶...
來源:愛集微 -
中國移動(dòng)河北雄安分公司 打造節(jié)能降耗新模式
作為河北雄安新區(qū)首個(gè)集中建成區(qū),容東片區(qū)承載著10余萬居民征遷安置的重要功能,它的通信保障與居民生...
來源:人民郵電報(bào) -
聯(lián)電公司6月營收達(dá)248.26億元新臺幣 連續(xù)九個(gè)月創(chuàng)單月歷史新高
聯(lián)電今(6)日公布的財(cái)報(bào)顯示,該公司 6 月營收達(dá)248 26 億元新臺幣(約 56 11 億元人民幣),月增 ...
來源:愛集微 -
中國工程院院士朱高峰 以超世之才和堅(jiān)忍不拔之志為槳
古之立大事者,不惟有超世之才,亦必有堅(jiān)忍不拔之志。從青絲到白發(fā),知識報(bào)國初心未改,60年與通信為伴...
來源:人民郵電報(bào) -
-
花未全開月未圓究竟是誰寫的 花未全開月未圓和曾國藩有什么淵源?
最近,花未全開月未圓這句詩因一個(gè)廣告短片在網(wǎng)上破圈走紅。那么,這句意外翻紅的古詩究竟是誰寫的?和曾...
來源:星際派
直播更多》
-
富士膠片宣布對其美國業(yè)務(wù)3.5億美元投資計(jì)劃 將用于產(chǎn)能擴(kuò)展和產(chǎn)品研發(fā)
半導(dǎo)體材料廠商富士膠片(FUJIFILM)日前...
-
富士膠片宣布對其美國業(yè)務(wù)3.5億美元投資計(jì)劃 將用于產(chǎn)能擴(kuò)展和產(chǎn)品研發(fā)
半導(dǎo)體材料廠商富士膠片(FUJIFILM)日前...
-
國家公路網(wǎng)最新規(guī)劃出爐 總規(guī)模約46.1萬公里
7月12日,國家發(fā)展改革委舉行專題新聞發(fā)...
-
鄉(xiāng)村治理盡在屏中 青海首個(gè)5G數(shù)字鄉(xiāng)村試點(diǎn)項(xiàng)目落戶寺爾溝村
詩仙李白有詩云:明月出天山,蒼茫云海...
-
馬斯克放棄收購?fù)铺?將讓華爾街銀行損失慘重
特斯拉首席執(zhí)行官埃隆?馬斯克 (Elon ...
-
佛羅里達(dá)州男子轉(zhuǎn)售假冒思科設(shè)備被捕 涉案設(shè)備價(jià)值超10億美元
美國檢察官宣布逮捕一名來自佛羅里達(dá)州...
資訊更多》
-
Z世代在網(wǎng)絡(luò)搜索時(shí)...
-
合肥物質(zhì)科學(xué)研究...
-
多為先為 南京電...
-
推特組建專門律師...
-
馬斯克將大幅提高...
-
打造高品質(zhì)服務(wù) ...
焦點(diǎn)
- 星際飛船超級重型助推器發(fā)生爆炸后損壞并不嚴(yán)重 或?qū)⒂谙轮苤胤蛋l(fā)射臺
- 國家電網(wǎng)能源互聯(lián)網(wǎng)產(chǎn)業(yè)雄安創(chuàng)新中心開工 總投資27.2億
- 細(xì)心呵護(hù)老年人生活 甘肅聯(lián)通93個(gè)“智慧助老”體驗(yàn)中心同步啟用
- 人民至上生命至上 成研院打造院前急救系統(tǒng)新模式
- 為避開廣告業(yè)務(wù)反壟斷訴訟 谷歌向美國司法部提交新方案
- 城區(qū)老舊小區(qū)故障多發(fā) 莆田電信開展管線故障搶通整修工作
- 610億美元 博通收購VMware將繼續(xù)進(jìn)行交易
- 河南省三門峽市澠池縣 99元“全家福”搭建山鄉(xiāng)百姓致富金橋
- 科技部與寧夏建立新一輪部區(qū)工作會商制度 時(shí)間為2022年至2026年
- 銫是元素周期表第幾號元素 銫元素的用途有哪些?