【導(dǎo)讀】
人工智能、傳感器質(zhì)量和計算能力的巨大進步,給無人車的革命打下了技術(shù)基礎(chǔ)。然而,盡管出現(xiàn)了這些創(chuàng)新,但在未來很多年內(nèi),人類仍然需要在幕后默默奉獻,才能讓這些系統(tǒng)保持最好的狀態(tài)。
病友們都在看雜志、刷Instagram的時候,Shari Forrest打開了手機上的一個app,開始訓(xùn)練一個將要用在無人車上的人工智能。
54歲的Forrest并非工程師或程序員,她靠撰寫教材來謀生。盡管如此,在平時有空時,F(xiàn)orrest依然會在Mighty AI上登錄,然后把自己的時間花在給行人、垃圾桶,以及任何其他你不希望無人車撞上的東西做標記上。
Mighty AI是一家人工智能眾包服務(wù)平臺。在這里,F(xiàn)orrest的“同事”們在全球范圍內(nèi)還有20萬人。這家公司提供的主要服務(wù)包括計算機視覺、自動駕駛、自然語言處理等。今年1月,公司剛剛宣布完成1400萬美元B輪融資。
“如果能趁著排隊的工夫賺幾塊錢的話,何樂而不為呢?!癋orrest說。
對于無人車產(chǎn)業(yè)而言,在自動駕駛時代真正到來之前,類似Forrest所做的這種數(shù)據(jù)標注工作都是不可或缺的。要對自動駕駛賴以實現(xiàn)的AI進行訓(xùn)練,所需的數(shù)據(jù)量往往超出了想象。
谷歌和通用這種公司很少去提這件事情,但正是像Forrest一樣的人們組成的勞動力大軍,構(gòu)成了那些嗡嗡作響的數(shù)據(jù)中心背后的基石。
多數(shù)開發(fā)自動駕駛技術(shù)的公司會聘用成百上千名員工,然后把這種教會無人車識別行人、騎行者和其他障礙物的工作外包到印度或中國。這些工人需要對長達數(shù)千小時的視頻逐幀進行標記。
“機器學習是個神話,就像《綠野仙蹤》一樣?!惫韫扔布趸鞴綥emnos Labs的投資人Jeremy Conrad說,“標記團隊對每家公司都至關(guān)重要,我們一段時間內(nèi)仍然需要他們,因為戶外環(huán)境十分多變?!?/P>
人工智能、傳感器質(zhì)量和計算能力的巨大進步,給無人車的革命打下了技術(shù)基礎(chǔ)。然而,盡管出現(xiàn)了這些創(chuàng)新,但在未來很多年內(nèi),人類仍然需要在幕后默默奉獻,才能讓這些系統(tǒng)保持最好的狀態(tài)。
“在我看來,人工智能從業(yè)人員整體都很自大,認為電腦可以解決一切?!盡ighty AI創(chuàng)始人兼CEO Matt Bencke說。人工智能系統(tǒng)也都存在同樣的問題:電腦需要通過人工添加標簽的龐大數(shù)據(jù)進行“學習”,然后利用這種‘模型’在今后看到類似的物體和形態(tài)時將其識別出來。
訓(xùn)練無人車面臨的挑戰(zhàn)比其他人工智能應(yīng)用更大,因為汽車所要面臨的場景和環(huán)境是開放性的。即便是針對不同時間的燈光和天氣環(huán)境進行調(diào)整后,城市環(huán)境仍會因為建筑、活動或事故而在一夜之間發(fā)生變化。
“標注過程通常都是一項非常隱秘的成本,很少被人提及?!弊詣玉{駛創(chuàng)業(yè)公司Drive.ai首席執(zhí)行官Sameep Tandon說,“這非常痛苦,也非常麻煩?!?/P>
無人車所需的精度也高于其他人工智能系統(tǒng)。汽車之所以能夠自動駕駛,是通過將它們借助攝像頭和傳感器看到的周圍環(huán)境,與車載3D地圖進行比對來實現(xiàn)的。安全是頭等大事:如果Google Photos的面部識別無法正確認出一張照片中的人,那也沒什么大不了;但如果Waymo的無人車無法識別行人,就會引發(fā)致命事故。
在爭相開發(fā)無人車的過程中,企業(yè)的衡量標準都是他們的累計行駛里程。Waymo今年5月表示,他們的汽車已經(jīng)在公共道路上試駕了300萬英里,而特斯拉去年表示,他們已經(jīng)借助Autopilot系統(tǒng),通過現(xiàn)有的車主收集了1000多萬英里的駕駛數(shù)據(jù)。
然而,里程越多,就意味著這些公司的后臺數(shù)據(jù)處理人員需要手工從事更多工作。短短幾英里的駕駛里程就會產(chǎn)生數(shù)十GB的數(shù)據(jù),這些數(shù)據(jù)很快就會變得過于龐大,以至于無法通過車載無線網(wǎng)絡(luò)進行傳輸。相反,必須首先保存在硬盤之中,然后再傳輸?shù)降酵獍行摹?/P>
這樣一個擁有尖端技術(shù)的行業(yè),卻采用如此陳舊的模式,的確令人感到意外。
硅谷自動駕駛系統(tǒng)開發(fā)公司PlusAI首席執(zhí)行官David Liu表示,每駕駛一個小時,就需要花費數(shù)百個小時才能將其轉(zhuǎn)化成有用的數(shù)據(jù)。
他說,“我們需要幾十萬,甚至幾百萬小時的數(shù)據(jù)”才能讓無人車隨處行駛,并且需要“數(shù)十萬人來實現(xiàn)這一目標”。
但大型科技公司通常不肯披露無人車所涉及的人工程序。Waymo、Uber和特斯拉均拒絕對此置評。
“很難聽到有人談?wù)摯耸隆!比A盛頓大學計算機科學與工程教授Dan Weld說,“他們都喜歡說,機器學習很神奇?!?/P>
曾經(jīng)擔任Waymo和Uber工程師的Anthony Levandowski曾于2013年在加州大學伯克利分校的公開演講中,將谷歌的印度團隊稱作一個由“人類機器人”組成的團隊,他們負責標記街景服務(wù)采集的各種圖像。
這種勞動密集型工作的成本并不低。業(yè)內(nèi)人士估計,要創(chuàng)建和維護每座美國城市的地圖,一年的花費約為數(shù)十億美元。
有的創(chuàng)業(yè)公司從中看到了機會,PlusAI、Deepmap和Drive.ai都聲稱可以使用“深度學習”來降低人工成本,但仍然可以維持安全駕駛所需的精度。但其他業(yè)內(nèi)人士仍然懷疑,深度學習難以徹底擺脫對人類的依賴。
Mighty AI的 Bencke指出,F(xiàn)acebook、YouTube和Twitter面臨的挑戰(zhàn),是如何在他們的社交平臺上應(yīng)對欺凌和恐怖主義等各種負面內(nèi)容?!叭绻疃葘W習具備這種能力,你不認為它現(xiàn)在就應(yīng)該已經(jīng)解決這個問題了嗎?”他說,“這個問題沒有無人車那么復(fù)雜,而且市場很大?!?/P>
當下,AI的智慧在更大程度上仍然取決于它所用來訓(xùn)練的數(shù)據(jù)的質(zhì)量。Bencke稱自家的平臺會用自己的機器學習技術(shù),來判定每個人最為擅長的領(lǐng)域,并以此來分配工作。沒人因此變得富裕,但對于Mighty AI來講,這無關(guān)緊要。
Forrest說,自己去年在這項工作上掙了300美元,大部分都用來網(wǎng)購了。她從沒見過無人車,更別提乘坐一次。但她知道自己正讓它們變得更為聰明,也對這項技術(shù)的未來充滿信心。
2024-10-16 11:29
2024-10-14 09:19
2024-10-14 08:46
2024-10-13 12:05
2024-10-11 11:57
2024-10-10 10:00
2024-10-09 10:05
2024-10-08 11:01
2024-10-08 09:55
2024-09-29 10:07