給記者一個(gè)時(shí)髦的詞,讓他對(duì)此進(jìn)行寫(xiě)作,記者們可能需要花上一天的時(shí)間;若給記者一個(gè)未曾了解的選題,讓記者們進(jìn)行深度寫(xiě)作,這可能需要記者們花更多的時(shí)間來(lái)對(duì)整個(gè)行業(yè)進(jìn)行深入了解和探索。人工智能便是如此。
這段時(shí)間來(lái),我們總是收到各種關(guān)于人工智能威脅論的警告,尤為典型的是,馬斯克多番強(qiáng)調(diào)人工智能不僅會(huì)造成大面積的失業(yè),威脅人類的發(fā)展,甚至還會(huì)引發(fā)第三次世界大戰(zhàn)。隨著IBM重金加持沃森機(jī)器人、富士康立下全機(jī)器人組裝目標(biāo)并裁員后,人們對(duì)人工智能發(fā)展的質(zhì)疑聲音逐步升高。但有影響力的人工智能研究報(bào)告并不多,也很少有主流媒體引用,似乎專家學(xué)者們都認(rèn)為目前的人工智能發(fā)展程度還很低,還有許多技術(shù)上的問(wèn)題需要突破。在20世紀(jì)50年代至80年代之間,也出現(xiàn)過(guò)幾波人工智能的浪潮,但這次或許不同于前幾次。
聊天機(jī)器人的bug鬧劇
在2017年6月14日,TechCrunch曾報(bào)道了一篇文章:《Facebook最新研究:我們訓(xùn)練機(jī)器人討價(jià)還價(jià),沒(méi)想到AI還自己學(xué)會(huì)了“使詐”,大意是,F(xiàn)acebook研發(fā)了具備談判能力的機(jī)器人,而后,F(xiàn)acebook 人工智能研究所(FAIR)繼續(xù)用機(jī)器學(xué)習(xí)對(duì)兩個(gè)聊天機(jī)器人進(jìn)行對(duì)話策略升級(jí),結(jié)果發(fā)現(xiàn)它們自行發(fā)展出了人類無(wú)法理解的獨(dú)特語(yǔ)言。
2017年6月15日,《大西洋月刊》公布了Facebook研發(fā)的AI機(jī)器人Bob和Alice的一段“對(duì)話”記錄,并稱“機(jī)器人創(chuàng)造了人類無(wú)法理解的語(yǔ)言”,引起了大家的恐慌。
而后,F(xiàn)acebook 研究院宣布暫停整改這一項(xiàng)目,根據(jù)某家海外媒體的說(shuō)法,原因是“擔(dān)心失去對(duì)這些AI的控制”。這本來(lái)只是作者的玩笑話,卻不料上了各大科技媒體頭條,引發(fā)了一波三折的”失控“大戲。
之所以會(huì)發(fā)生這樣的鬧劇,是因?yàn)镕acebook科研團(tuán)隊(duì)在開(kāi)發(fā)前期沒(méi)有為機(jī)器人設(shè)置正確的“獎(jiǎng)勵(lì)”,鼓勵(lì)他們說(shuō)人話。說(shuō)白了,這其實(shí)就是一個(gè)bug問(wèn)題。這樣的問(wèn)題在語(yǔ)言模型初學(xué)者的嘗試中十分常見(jiàn),只不過(guò)這次出現(xiàn)在了Facebook這樣的大公司上,才會(huì)被各大媒體爭(zhēng)相報(bào)道,并被誤解為機(jī)器人的“早慧”。
今天的機(jī)器人仍處于起步階段,但AI被應(yīng)用到各大行業(yè)領(lǐng)域,并給各大行業(yè)帶來(lái)了新變革。
在一個(gè)干凈的房間里,我?guī)缀蹩梢钥吹酱┲着鄣难芯咳藛T在檢查毒氣閥門是否關(guān)掉,并且他們就人工智能對(duì)人類的意義展開(kāi)了一系列辯論。也許,這只是我的幻想,但許多類似終結(jié)者的形象已紛紛呈現(xiàn)在我們的面前。
在機(jī)器學(xué)習(xí)系統(tǒng)上,有一個(gè)亟需解決的問(wèn)題,即調(diào)試問(wèn)題,來(lái)自谷歌的Peter Norvig強(qiáng)調(diào)。一旦系統(tǒng)中出現(xiàn)了一個(gè)問(wèn)題,那么這個(gè)問(wèn)題便會(huì)被復(fù)制到整個(gè)系統(tǒng)中。雖然可以重新培訓(xùn)機(jī)器學(xué)習(xí)系統(tǒng),但是問(wèn)題無(wú)法單獨(dú)解決。
在Facebook的談判機(jī)器人中,我們不能確定無(wú)法正確解析語(yǔ)言造成的的信號(hào)退化問(wèn)題將有多嚴(yán)重,事實(shí)上,我們甚至不知道機(jī)器人語(yǔ)言的含義,也許,我們認(rèn)為機(jī)器人語(yǔ)法和人類語(yǔ)法是一致的。
聊天機(jī)器人的真正語(yǔ)言是什么?
在聊天機(jī)器人的背后,其實(shí)是一套復(fù)雜的系統(tǒng),主要包括5個(gè)功能模塊:語(yǔ)音識(shí)別模塊、自然語(yǔ)言理解模塊、對(duì)話管理模塊、自然語(yǔ)言生成模塊、語(yǔ)音合成模塊。
首先,語(yǔ)音識(shí)別模塊負(fù)責(zé)接收用戶輸入的語(yǔ)音并將其轉(zhuǎn)換成文字形式。
然后,自然語(yǔ)言理解模塊在理解了用戶輸入的語(yǔ)義之后將特定的語(yǔ)義表達(dá)式輸入到對(duì)話管理模塊中。
接著,對(duì)話管理模塊負(fù)責(zé)協(xié)調(diào)各個(gè)模塊的調(diào)用及維護(hù)當(dāng)前對(duì)話狀態(tài),選擇特定的回復(fù)方式并交由自然語(yǔ)言生成模塊進(jìn)行處理。
最后,自然語(yǔ)言生成模塊生成回復(fù)文本輸入給語(yǔ)音合成模塊將文字轉(zhuǎn)換成語(yǔ)音輸出給用戶。
通常來(lái)說(shuō),聊天機(jī)器人系統(tǒng)中的自然語(yǔ)言理解功能包括用戶意圖識(shí)別、用戶情感識(shí)別、指代消解、省略恢復(fù)、回復(fù)確認(rèn)及拒識(shí)判斷等技術(shù)。
對(duì)話管理功能主要協(xié)調(diào)聊天機(jī)器人的各個(gè)部分,并維護(hù)對(duì)話的結(jié)構(gòu)和狀態(tài)。對(duì)話管理功能中涉及到的關(guān)鍵技術(shù)主要有對(duì)話行為識(shí)別、對(duì)話狀態(tài)識(shí)別、對(duì)話策略學(xué)習(xí)及對(duì)話獎(jiǎng)勵(lì)等。
自然語(yǔ)言生成通常根據(jù)對(duì)話管理部分產(chǎn)生的非語(yǔ)言信息,自動(dòng)生成面向用戶的自然語(yǔ)言反饋
現(xiàn)在的聊天機(jī)器人還存在著諸多的問(wèn)題,聊天機(jī)器人無(wú)法根據(jù)對(duì)話背景給出恰當(dāng)回答,對(duì)于某些深入的課題也無(wú)法做到真正意義上的理解與交流,在回答正確率、任務(wù)完成率、對(duì)話是否及時(shí)響應(yīng)等方面也有待提高。至于聊天機(jī)器人是否會(huì)開(kāi)啟自己的智慧,形成自己的語(yǔ)言,我想,這大概還很遙遠(yuǎn),畢竟,目前的聊天機(jī)器人很多時(shí)候還聽(tīng)不懂人話呢。
2024-09-14 08:54
2024-09-13 09:23
2024-09-10 09:46
2024-09-09 08:09
2024-09-07 09:58
2024-09-06 09:12
2024-09-03 09:08
2024-09-01 08:20