自主車輛和機(jī)器人領(lǐng)域通常采用激光雷達(dá)作為主要的系統(tǒng)導(dǎo)航傳感器。但相機(jī)和基于視覺的感知將越來越多地成為移動機(jī)器人的技術(shù)基礎(chǔ)。
大多數(shù)自動駕駛汽車制造商將高端3D激光雷達(dá)(LiDAR)以及其他傳感器納入他們的車輛,以便為他們提供足夠的數(shù)據(jù),充分了解他們的周圍環(huán)境并安全運行。然而,在2019年4月,埃隆-馬斯克在特斯拉的自動駕駛?cè)丈细嬖V與會者,LiDAR是一個 "傻瓜的差事"--任何依賴它的人都是 "注定的",指的是特斯拉對基于視覺的感知的偏愛。
LiDAR/視覺的辯論一直持續(xù)到今天。但從那時起,自動駕駛汽車市場對攝像頭和計算機(jī)視覺的重視程度在穩(wěn)步提高。
基于視覺的AMR導(dǎo)航
最近,在移動機(jī)器人市場上也出現(xiàn)了同樣的爭論,幾十年來,傳統(tǒng)的二維激光雷達(dá)一直是主流的導(dǎo)航傳感器。一些AMR制造商,包括Canvas Technology(被亞馬遜收購),Gideon Brothers和Seegrid,已經(jīng)開發(fā)了具有不同程度的基于視覺的導(dǎo)航的AMR。
這些AMR公司選擇基于攝像頭的導(dǎo)航解決方案的原因之一是,與LiDAR相比,視覺系統(tǒng)的成本較低。但最令人信服的原因是基于視覺的系統(tǒng)能夠?qū)崿F(xiàn)全三維定位和感知。
尋求替代方案
三維激光雷達(dá)也是希望在其系統(tǒng)中增加三維感知能力的機(jī)器人開發(fā)商的一個選擇。但是,雖然3D LiDAR解決方案的價格在過去幾年中有所下降,但3D感知的總系統(tǒng)成本仍然是成千上萬美元。
對于機(jī)器人領(lǐng)域來說,汽車級3D LiDAR的成本通常很高。因此,機(jī)器人制造商繼續(xù)尋求成本較低的3D LiDAR替代品來實現(xiàn)3D感知。
攝像機(jī)可以看到天花板、地板上的自然特征,以及設(shè)施另一側(cè)的遠(yuǎn)處。
基于攝像頭的視覺系統(tǒng)
基于相機(jī)的視覺系統(tǒng)本質(zhì)上可以應(yīng)對感知的挑戰(zhàn),因為它們可以 "看到 "其視野內(nèi)的一切并將其數(shù)字化。 利用其他行業(yè)的規(guī)模經(jīng)濟(jì),即使成本低于20美元的相機(jī)也能提供足夠的分辨率和視野,以支持強(qiáng)大的定位、障礙物檢測和更高水平的感知。
在具有挑戰(zhàn)性的環(huán)境中進(jìn)行定位
基于視覺的導(dǎo)航的另一個重要優(yōu)勢是能夠處理LiDAR失去穩(wěn)健性的挑戰(zhàn)性環(huán)境。典型的例子是物流倉庫,那里的一排排機(jī)架和貨架系統(tǒng)在整個設(shè)施中重復(fù)出現(xiàn)。
攝像機(jī)還可以看到天花板、地板上的自然特征,以及設(shè)施另一側(cè)的遠(yuǎn)處。但是LiDAR所能看到的世界的二維 "切片 "根本不足以區(qū)分這些環(huán)境中不同的、重復(fù)的特征。因此,基于LiDAR的機(jī)器人在許多情況下會感到困惑,甚至完全迷失。
這些挑戰(zhàn)也適用于開放或高度動態(tài)的環(huán)境,如交叉碼頭和開放的倉儲設(shè)施。LiDAR在上次訪問時看到并解釋的 "切片 "現(xiàn)在可能是開放空間--或者完全是其他東西。
最終,為了實現(xiàn)真正的智能自主行為,導(dǎo)航系統(tǒng)必須提供人類水平的三維感知。
三維感知和場景理解
最后,也是最重要的,基于視覺的感知可以實現(xiàn)其他類型的傳感器根本無法實現(xiàn)的功能。最終,為了實現(xiàn)真正的智能自主行為,導(dǎo)航系統(tǒng)必須提供人類水平的三維感知。例如,由于攝像機(jī)可以檢測到紋理和顏色,因此能夠區(qū)分人行道的邊緣和道路的邊緣。這可以為送貨機(jī)器人創(chuàng)造顯著的安全優(yōu)勢,因為機(jī)器人可以利用這一視覺信息精確地沿著其邊緣導(dǎo)航,就像人類一樣。
這種能力在倉庫和生產(chǎn)設(shè)施中非常有用,因為那里的行人道路是用線條和地板標(biāo)記來定義的。 基于攝像頭的系統(tǒng)甚至可以讀取標(biāo)志和符號,提醒人類和機(jī)器人注意臨時關(guān)閉、潮濕的地板和繞道。 基于視覺的導(dǎo)航系統(tǒng)還能夠在室內(nèi)和室外環(huán)境中工作--開辟了新的用例和應(yīng)用。
挑戰(zhàn)
在低成本的硬件上將來自相機(jī)的大量數(shù)據(jù)轉(zhuǎn)換為3D感知是一個巨大的技術(shù)和工程挑戰(zhàn)。這個過程需要工程師具備大量的人工智能、計算機(jī)視覺和傳感器融合方面的專業(yè)知識,同時還需要有配套的技術(shù)。
值得慶幸的是,基于攝像頭的3D感知的強(qiáng)大的、可執(zhí)行的解決方案現(xiàn)在已被機(jī)器人工程師所接受。例如,RGo機(jī)器人公司的解決方案--感知引擎,是一個全棧式的軟件解決方案,使制造商能夠迅速提供下一代的能力。在一些應(yīng)用中,它能夠只利用一個攝像頭來實現(xiàn)精確的三維定位和感知。它的寬視場相機(jī)還能夠識別人類和周圍的其他障礙物。這種水平的場景理解使移動機(jī)器人在人類周圍的行為更加自然和協(xié)作。
其他模式
綜上所述,包括LiDAR在內(nèi)的傳統(tǒng)傳感器模式仍然具有重要價值。最近在低成本MEMS三維激光雷達(dá)方面取得的進(jìn)展令人鼓舞,當(dāng)與相機(jī)結(jié)合時,可以為機(jī)器人系統(tǒng)增加具有成本效益的穩(wěn)健性和豐富的三維制圖能力。
但馬斯克說的沒錯,相機(jī)和計算機(jī)視覺應(yīng)該作為任何移動機(jī)器人導(dǎo)航系統(tǒng)的基礎(chǔ)。未來幾年肯定會看到動態(tài)變化,因為隨著自主車輛和機(jī)器人行業(yè)的進(jìn)步,最先進(jìn)的技術(shù)也在不斷發(fā)展。
關(guān)于作者
Peter Secor作為市場營銷和業(yè)務(wù)發(fā)展高級副總裁,負(fù)責(zé)建立RGo機(jī)器人公司的品牌,并為公司尋找新的客戶和市場機(jī)會。 在加入RGo之前,他曾在物聯(lián)網(wǎng)、工業(yè)自動化、機(jī)器人和3D打印的前沿和交叉領(lǐng)域的公司擔(dān)任變革性職務(wù),包括iRobot和Stratasys。 Secor的職業(yè)生涯開始于管理顧問,他專門為工業(yè)自動化市場的財富500強(qiáng)公司提供企業(yè)戰(zhàn)略發(fā)展和并購,包括羅克韋爾自動化、西門子和霍尼韋爾。 他擁有新罕布什爾大學(xué)的機(jī)械工程學(xué)士學(xué)位和哥倫比亞大學(xué)哥倫比亞商學(xué)院的MBA學(xué)位,主修技術(shù)增長營銷。
2024-10-18 10:00
2024-10-18 09:59
2024-10-18 09:57
2024-10-18 09:56
2024-10-18 09:54
2024-10-18 09:54
2024-10-18 09:53
2024-10-17 11:48
2024-10-17 10:09
2024-10-17 09:06