機(jī)器人早已在工業(yè)流水線尤其是制造業(yè)上得到了廣泛的應(yīng)用,比如手機(jī)制造、汽車組裝等。在最初的應(yīng)用中,機(jī)器人的設(shè)計(jì)被固定在某一項(xiàng)任務(wù)當(dāng)中,打眼就是打眼,安螺絲就是安螺絲。在這個(gè)時(shí)期,工業(yè)機(jī)器人實(shí)質(zhì)上是替代了簡(jiǎn)單的組裝工作,并且只適應(yīng)設(shè)計(jì)好的特定環(huán)節(jié),基本沒有任何延展性。
而在人工智能時(shí)代,加入了機(jī)器視覺之后,機(jī)器人的應(yīng)用范圍逐漸一下子被擴(kuò)大了許多。更多的行業(yè)被涉足并發(fā)生了質(zhì)的革新,比如物流的智能分揀。
目前來說,對(duì)機(jī)器人進(jìn)行視覺訓(xùn)練,應(yīng)用在工業(yè)當(dāng)中的基本任務(wù)就是:認(rèn)識(shí)某物。也就是說,通過對(duì)機(jī)器的訓(xùn)練,使其能夠分辨出哪一樣是自己的工作對(duì)象。而這也是機(jī)器視覺學(xué)習(xí)的最簡(jiǎn)單而有效的應(yīng)用。
但工業(yè)應(yīng)用場(chǎng)景并不僅僅只有識(shí)別。比如對(duì)倉(cāng)儲(chǔ)物品的抓取和分類,或者很多并不是固定物品的應(yīng)用場(chǎng)景,這就會(huì)導(dǎo)致機(jī)器既有的學(xué)習(xí)內(nèi)容用不上。那么,不認(rèn)識(shí)這個(gè)東西,機(jī)器就不知道該如何處理,在做一些抓取搬運(yùn)工作的時(shí)候就難免會(huì)出岔子。
從這個(gè)角度上來說,以后對(duì)工業(yè)機(jī)器人的要求,將不滿足于局限于既有的學(xué)習(xí)內(nèi)容,同樣還要有自主的學(xué)習(xí)能力。也就是說,在機(jī)器人碰到陌生的物體的時(shí)候,能夠自主地判斷該怎么去處理。
AI繪制三維圖形,判斷最佳抓取姿勢(shì)
有人覺得,培養(yǎng)機(jī)器人的遷移學(xué)習(xí)能力不就好了嗎?比如記住一些物體的具體特征,人工智能既然能分辨出什么是人、什么是大猩猩、什么是貓狗,那么只要訓(xùn)練到位,機(jī)器人同樣也能對(duì)其他陌生的物體做出分辨。
但很可惜這樣想可能有點(diǎn)不切實(shí)際。比如讓機(jī)器人去把倉(cāng)庫(kù)里亂七八糟的東西給歸置整齊了,里面可能有大電視機(jī),也可能有小面包機(jī),它怎么分類?它該怎么拿?所以,很顯然用認(rèn)識(shí)同一類物體的方法是不適用于這樣的場(chǎng)景當(dāng)中的。
那么,為了讓機(jī)器人什么都能拿,麻省理工的研究人員們動(dòng)了點(diǎn)心思。
研究人員設(shè)計(jì)了這樣一個(gè)系統(tǒng):面對(duì)自己不熟悉的物體,機(jī)器人能夠快速地對(duì)其進(jìn)行估算,然后做出最適合的抓取和細(xì)節(jié)處理決策。該系統(tǒng)被稱為DON(Dense Object Nets,密集物體聯(lián)網(wǎng)),通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),機(jī)器人可以產(chǎn)生一個(gè)視覺路線圖,對(duì)物體進(jìn)行一個(gè)約莫20分鐘的視覺檢查。
在此基礎(chǔ)上,機(jī)器人會(huì)從多個(gè)角度來確定物體的點(diǎn),然后把所有的點(diǎn)形成一個(gè)整體坐標(biāo)系統(tǒng)。把這些點(diǎn)聯(lián)系到一起之后,就可以繪制出物體的三維立體圖。值得注意的是,在繪制三維立體圖的過程中,機(jī)器完全不需要人的干預(yù),因此這種學(xué)習(xí)方式又被稱為自我監(jiān)督式學(xué)習(xí)。
這樣的學(xué)習(xí)過程其實(shí)是和人類有很大的相似之處。我們看到暖瓶知道要握把才能提起,該系統(tǒng)的目的也是訓(xùn)練機(jī)器人的這種能力。只不過在目前的實(shí)驗(yàn)中,三維立體圖形繪制出來之后,還需要研究人員在電腦上給出指定的位置,以告訴機(jī)器人從哪里下手。
在實(shí)驗(yàn)中,機(jī)器人成功抓起了一只鞋子和杯子。
其實(shí)對(duì)機(jī)器人進(jìn)行不同環(huán)境、物體的抓取訓(xùn)練思路,麻省理工并不是第一個(gè)。2016國(guó)內(nèi)一家科技公司就研發(fā)出了首套基于3D視覺定位系統(tǒng)的機(jī)器人,可以達(dá)到每秒1200萬點(diǎn)的快速掃描,從而建立一個(gè)物體的3D模型。再經(jīng)過一系列的智能分析,可以判斷出物體當(dāng)時(shí)的擺放姿態(tài),從而完成一套抓取動(dòng)作。
可以預(yù)見的是,今后也將有越來越多的關(guān)于基于3D立體判斷的工業(yè)機(jī)器人解決方案出現(xiàn)。讓機(jī)器人從簡(jiǎn)單的識(shí)別固定唯一的物體到自如地適應(yīng)不同物體抓取,也將成為工業(yè)機(jī)器人領(lǐng)域中不可忽視的重要技術(shù)。
抓得穩(wěn)又抓得準(zhǔn),人類的雙手該歇歇了
目前來說,該技術(shù)的最大問題在于建模所需的時(shí)間還比較長(zhǎng),遠(yuǎn)遠(yuǎn)無法滿足即時(shí)的工業(yè)應(yīng)用需求。
上文介紹的麻省理工的研究,其要實(shí)現(xiàn)對(duì)物體的三維圖像描繪需要大概二十分鐘的時(shí)間。但在做個(gè)搬運(yùn)工的時(shí)候,比如說清理房間,很可能會(huì)遇到非常多的不認(rèn)識(shí)的物品。對(duì)這種機(jī)器人來說,每個(gè)物品都需要重新認(rèn)識(shí)一遍。認(rèn)識(shí)一個(gè)花二十分鐘,搬運(yùn)一下一分鐘,那得了,整個(gè)時(shí)間就都消耗在這上面了。
而工業(yè)最講究的就是效率,如果能通過提升芯片計(jì)算速度、優(yōu)化算法的方法令機(jī)器人快速建模并實(shí)現(xiàn)實(shí)時(shí)自主抓取,無疑是最成熟。當(dāng)然,這對(duì)機(jī)器而言存在的困難還是很大。畢竟人類的神經(jīng)元有1000億個(gè),其形成的人類大腦反應(yīng)恐怕機(jī)器在很長(zhǎng)的一段時(shí)間內(nèi)都很難企及。
如果機(jī)器人能實(shí)現(xiàn)抓取的即時(shí)反應(yīng)、利用視覺判斷物體材料和表面光滑度控制好抓取力度等,其在無論是工業(yè)場(chǎng)景、消費(fèi)場(chǎng)景還是其他場(chǎng)景等都將充滿廣闊的想象力。
搬家機(jī)器人。以前搬家,打幾個(gè)包袱弄輛推車,找?guī)讉€(gè)鄰居幫忙就可以搞定。而現(xiàn)在隨著家居用品的日益增加,搬家成為了一件巨麻煩的事情。很多人都會(huì)叫搬家公司來幫忙。實(shí)質(zhì)上這就是在購(gòu)買勞動(dòng)。搬家貴,主要就是人力成本太高。當(dāng)機(jī)器人搬運(yùn)東西的時(shí)候可以做到舉重若輕,搬家工人或許將逐漸被取代。干活快、不發(fā)牢騷、不用發(fā)工資、購(gòu)買一次可以長(zhǎng)期重復(fù)使用,對(duì)搬家公司而言,利用搬家機(jī)器人可謂一勞永逸。成本降低之后,相應(yīng)地搬家公司的收益會(huì)提高,而分?jǐn)偟较M(fèi)者身上的成本也會(huì)大大降低。
優(yōu)化機(jī)器人無序抓取。在工業(yè)場(chǎng)景下,尤其是物流領(lǐng)域,很多物品的擺放都是散亂而無序的。傳統(tǒng)的機(jī)器人只是分揀符合自身程序設(shè)定標(biāo)準(zhǔn)的物件,最終仍然需要人工來對(duì)這些貨物進(jìn)行碼垛等操作。當(dāng)機(jī)器人可以實(shí)現(xiàn)對(duì)物品的三維掃描繪制,就可以將抓取過程更加智能化,以前由兩個(gè)機(jī)器人做的事情現(xiàn)在一個(gè)就可以完成;以前由人工操作的碼垛任務(wù),最終也可以由機(jī)器完成。減少機(jī)器人配置和節(jié)省人力這兩方面,都將會(huì)得到優(yōu)化。
清理事故現(xiàn)場(chǎng)和救災(zāi)。嚴(yán)重的交通事故、工廠的意外爆炸、自然災(zāi)害或者其他會(huì)產(chǎn)生大量分解物體的事故現(xiàn)場(chǎng),清理是一件非常麻煩的事情。尤其是在一些危險(xiǎn)隱患尚未解除的時(shí)候,靈巧的機(jī)器人雙手可以代替人類作許多事情。而在地震等自然災(zāi)害之后,機(jī)器人可以代替人類深入現(xiàn)場(chǎng)做一些危險(xiǎn)情況排除工作,甚至可以直接參與救人行動(dòng)。
機(jī)器人抓取一直都是機(jī)器人研究領(lǐng)域的一個(gè)熱點(diǎn)問題,這也正從一個(gè)側(cè)面了解決這個(gè)問題對(duì)整個(gè)機(jī)器人技術(shù)革新的重要意義。當(dāng)機(jī)器人在未來擁有了一雙和人類一樣靈巧的雙手的時(shí)候,可能也就意味著,人類的雙手將在更多的場(chǎng)景中得到徹底的解放。
而DON看起來,則很可能成為將在這場(chǎng)解放運(yùn)動(dòng)中發(fā)揮重要作用。
2024-09-14 08:54
2024-09-13 09:23
2024-09-12 09:22
2024-09-10 09:46
2024-09-09 08:09
2024-09-07 09:58
2024-09-06 09:12
2024-09-03 09:08
2024-09-01 08:20