在執(zhí)行聯(lián)合任務(wù)時,機(jī)器人之間可以保持著不間斷的通訊,比如“我通過了一扇門,正向右轉(zhuǎn)90度”,“前進(jìn)兩英尺,我遇到一堵墻,正右轉(zhuǎn)90度”,“前進(jìn)4英尺,我遇到一堵墻”……這樣它們能同時掌握事件的最新進(jìn)展。當(dāng)然,計算機(jī)能毫無困難地把大量信息歸檔存儲,需要時立即調(diào)出來,判斷出當(dāng)下情況,但對人類來說,這樣連串密集的數(shù)據(jù)會讓人瘋掉。
在前不久召開的美國人工智能發(fā)展協(xié)會年會上,麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室(csail)研究人員提出了一種模擬機(jī)器人合作的新方法,能使所需的通訊量減少60%。新模型讓設(shè)計人與機(jī)器人合作系統(tǒng)變得更容易,比如打造出一支人機(jī)合作的應(yīng)急救援隊伍。
降低多智能體系統(tǒng)通訊成本
在計算機(jī)術(shù)語中,多智能體系統(tǒng)(multiagentsystem)是自主智能體(電子的或非電子的)之間能實現(xiàn)任意協(xié)作的系統(tǒng)。每個主體既要能運行一個反映它所認(rèn)知的世界當(dāng)前狀態(tài)的模型,即機(jī)器人世界觀,還要能運行其他任何一個機(jī)器人的世界觀模型。在模型精確性概率中,機(jī)器人本身也是需要考慮的因素,它們必須以這些概率為基礎(chǔ),決定是否改變自己的行為。
模擬多智能體系統(tǒng)的方法稱為dec-pomdp(分布式部分可觀測馬爾可夫決策過程)。dec-pomdp系統(tǒng)包括多種不確定性,要考慮隊伍中某一個機(jī)器人的世界觀是否正確,它對伙伴世界觀的判斷是否正確,還要考慮它采取的任何一項行動能否成功。比如,機(jī)器人原計劃向前移動20英尺,卻發(fā)現(xiàn)橫向吹來的風(fēng)把自己吹得偏移了路線。如果一個機(jī)器人決定發(fā)布一條新信息,會迫使同伴也更新自己的模型,在整體中攪起新一輪的不確定性。如果這一信息并非必要的,就只會造成嚴(yán)重滯緩而達(dá)不到任何目的。
一般情況下,dec-pomdp系統(tǒng)會對環(huán)境情況做一些先驗假設(shè),讓機(jī)器人在這些假設(shè)的基礎(chǔ)上行動。但緊急反應(yīng)系統(tǒng)不能先做假設(shè),因為救援隊通常要進(jìn)入不熟悉的環(huán)境,最好的先驗知識也不管用。而且緊急救援要對環(huán)境有全局性掌握,算出一套多機(jī)器人方案極為耗時。研究人員的設(shè)計是,讓系統(tǒng)忽略行動效果的不確定性,假設(shè)無論一個機(jī)器人打算做什么,它都會去做。
協(xié)調(diào)個體行動使整體最優(yōu)化
當(dāng)機(jī)器人接到一條新信息,比如某建筑物內(nèi)一條通道被封閉了,它有3個選擇:一是忽視這條信息;二是采納它但不發(fā)布出去;三是采納并發(fā)布該信息——每個選擇都有優(yōu)點和相應(yīng)的通訊成本。如果機(jī)器人把新信息納入自己的世界觀模型但不發(fā)出去,也會產(chǎn)生成本,即對同伴來說,要判斷它的世界觀會更困難。對于每個機(jī)器人獲得的每條新信息,新系統(tǒng)會根據(jù)它們的世界模型、它們對伙伴行為的預(yù)期、更有效地完成共同目標(biāo)的可能性等,進(jìn)行成本—效益分析。
研究人員在300多個計算機(jī)上測試了他們的系統(tǒng),模擬在不熟悉的環(huán)境中完成救援任務(wù)。這套系統(tǒng)有多個版本,其中一個允許進(jìn)行廣泛通訊以完成任務(wù)。他們發(fā)現(xiàn),這一版本的速度比其他版本要高2%—10%,通訊量減少了60%。
研究人員指出,在多智能體系統(tǒng)中,可能有60%的通訊是不必要的。在這次實驗中,所有智能體都是計算機(jī)模擬的,而沒有人類參與。論文合著者、航空與航天學(xué)副教授朱莉·沙哈說:“我們還沒有在人類—機(jī)器人團(tuán)隊中實施這一系統(tǒng),但前景令人興奮??梢栽O(shè)想一下,你能將通訊量減少60%,或許對于人類完成自己在團(tuán)隊中的任務(wù)而言,這些通訊并非真正必要。”
設(shè)計人機(jī)合作應(yīng)急救援系統(tǒng)
澳大利亞墨爾本大學(xué)計算與信息系統(tǒng)副教授蒂姆·米勒說:“在人類團(tuán)隊中,如果某個隊員一接到新信息就將其發(fā)布給所有隊員,通常不是個好做法,尤其在通訊成本較高的情況下。這很容易理解。這項研究不止用于多智能體系統(tǒng),還能用于人類與智能體交互領(lǐng)域,這一領(lǐng)域的通訊成本很高。更重要的是,如果接受太多信息的話,人類隊員很快會不堪重負(fù)。”
在另一個項目中,研究人員讓人類志愿者團(tuán)隊執(zhí)行了與機(jī)器人系統(tǒng)相同的虛擬救援任務(wù),并通過機(jī)器學(xué)習(xí)算法,對人類的通訊模式進(jìn)行了統(tǒng)計分析,將分析結(jié)果納入新模型,讓系統(tǒng)能更明確地協(xié)調(diào)人機(jī)混合團(tuán)隊。
沙哈說,他們必須先在人類志愿者團(tuán)隊中進(jìn)行實驗,才能把這套系統(tǒng)用在人類與機(jī)器人混合團(tuán)隊中,如果系統(tǒng)總是告訴人們不真實的信息,人—機(jī)團(tuán)隊必然失敗。
2024-10-22 09:23
2024-10-22 09:22
2024-10-22 09:22
2024-10-22 09:20
2024-10-22 09:18
2024-10-22 09:17
2024-10-22 09:16
2024-10-21 08:53
2024-10-21 08:52
2024-10-21 08:51