“人最容易犯的一個錯誤,就是用現(xiàn)在的眼光去看未來的人?!?BR> 在談及未來人形機器人的陪伴是否會讓人更孤獨的問題時,優(yōu)必選創(chuàng)始人、CEO周劍如是回答。他說,隨著時間的推移,人類的倫理、道德、情感都會發(fā)生變化,他不知道未來人是否會變得更加“孤獨”,甚至很難想象30年后我們的孩子們會是什么樣子。
也許他們已經(jīng)在體內(nèi)植入了芯片,或是戴上了某些增強力量的裝置……
但周劍仍然對自己在做、要做的事情充滿信心。他相信人形機器人代表著未來。
按照維基百科的定義,人形機器人(humanoid robot)是一種“旨在模仿人類外觀和行為的機器人,或者合成生物體、人工生命體”。
其實,這個定義在“或者”前后出現(xiàn)了一定程度的割裂——制造一個有大腦、有智慧的“生命體”,與單純地開發(fā)一個外觀和動作像人的機器相比,二者在難度上存在本質(zhì)差異。因為制造難度以及成本的高昂,前者基本無法有效地實現(xiàn)商業(yè)化。
而近幾年被深度學(xué)習(xí)與大數(shù)據(jù)所帶動的人工智能復(fù)興,則有望讓人形機器人受益于相對更為成熟的語音交互和計算機視覺技術(shù),成為家庭場景下的新一代智能硬件接口。
這或許是一個風(fēng)口。近幾年,亞馬遜、谷歌、蘋果這些巨頭公司紛紛推出自己的智能音箱產(chǎn)品,試圖借由一種成本更低的智能交互方式來收割用戶。目前來看,搭載了語音助手的智能人形機器人與同樣搭載了語音助手的智能音箱相比,二者在產(chǎn)品形態(tài)上本質(zhì)上似乎區(qū)別不大。
但周劍堅信自己走在正確的道路上。
“將AI技術(shù)放在一個音箱上面,這可能是一種趨勢,一種交互方式上的變化?!痹趯⒅悄苋诵螜C器人與智能音箱進行對比時,周劍說,“記得之前我們和騰訊做過一個聯(lián)合調(diào)查,在北美的一些家庭用上Echo后,他們在家里使用手機的頻率降低了30%到40%。
數(shù)據(jù)不一定準(zhǔn)確,但在語音識別這些技術(shù)發(fā)展到一定程度后,它代表了一種方向?!?BR> “但我始終認為這只是一個過渡性的產(chǎn)品。目前,一些驅(qū)動、運動方面的機器人技術(shù)還不是很完善,商業(yè)化成本還沒有真正降下來。
但如果有一天,小型的機器人也能夠完成Echo的任務(wù),對于人類來講,與機器人之間的互動、交流一定更有樂趣。拋開成本、拋開價格,從長遠上看,桌面或者是大型機器人是未來發(fā)展的方向。”
采訪當(dāng)天,量子位現(xiàn)場體驗智能人形機器人Alpha 2。與同系列的第一代產(chǎn)品相比,搭載了攝像頭和科大訊飛語音操作平臺的Alpha 2能夠通過語音和圖像實現(xiàn)同用戶的互動,在體驗中,Alpha 2正確地給出了如“深圳今天天氣如何”、“美國總統(tǒng)是誰”這類問題的答案,也能跟從指令打開或關(guān)掉頂燈,最后甚至還仰面來了個周星馳的大笑。
周劍說,他們未來的目標(biāo)是打造服務(wù)機器人——可以端茶倒水、做菜做飯,甚至能在人不方便的時候幫助解決所有的事情。他認為,這種服務(wù)機器人是一種同之前所有產(chǎn)品都完全不同的品類,它不是一個單純的交互設(shè)備,而是能給人以陪伴的朋友。
他表示,要做一個能在家庭場景下完成簡單陪伴、教育等任務(wù)的人形機器人,讓它以一個大眾相對可接受的售價實現(xiàn)商業(yè)化,可能需要六到八年,而要實現(xiàn)“服務(wù)”,可能會需要更長時間。
讓人形機器人智能化需要解決哪些問題?
拋開伺服電機、液壓、氣壓這類外部機械控制技術(shù),我們只談機器人的內(nèi)部操作平臺。
去年年底,悉尼大學(xué)計算機科學(xué)教授陶大程加盟優(yōu)必選擔(dān)任人工智能首席科學(xué)家,負責(zé)人形機器人智能控制系統(tǒng)的開發(fā)。
據(jù)陶大程介紹,目前自己團隊的工作主要在以下三個方面:
人臉識別:家庭場景下的人形機器人需要能夠識別家庭中的成員。
物體檢測:對家庭場景中的常見物品進行識別、檢測。
人體姿態(tài)估計:作為人機交互的接口,機器人要理解人的動作、行為,首先要完成對于人體的姿態(tài)估計。
陶的主要工作集中于計算機視覺層面。相對醫(yī)療、工業(yè)場景,家庭場景的環(huán)境要更為復(fù)雜(受光線、油煙、物品擺放等因素影響),機器人的圖像識別能力也需要和場景直接相關(guān),因此一些通用型的物體識別算法可能并不適用。
同時,機器人搭載的攝像頭在成像上也有一定的局限性,目前的成像質(zhì)量還比較一般,需要通過更先進的傳感器以及一些類似圖像超分辨率分析的算法來解決;此外,還要考慮運動攝像時如何消除的運動模糊問題。
除了計算機視覺,要形成有效的人機交互,能夠?qū)θ祟愖匀徽Z言形成理解和反饋的語音系統(tǒng)其實是更關(guān)鍵的部分。自然語言處理也一直是AI領(lǐng)域一個難于克服、進展緩慢的難點。
在這一部分,優(yōu)必選將語音識別、自然語言理解、自然語言處理這類更為主要的技術(shù)工作交給了自己的投資者及合作方科大訊飛;此外,優(yōu)必選也曾在自己與亞馬遜合作的機器人Lynx上搭載Alexa語音平臺。
△優(yōu)必選與亞馬遜合作的機器人Lynx
據(jù)周劍透露,優(yōu)必選也在嘗試打造自己的智能操作系統(tǒng),并通過希望通過開發(fā)者社區(qū)形成自己的智能機器人產(chǎn)品生態(tài)。
行業(yè)還有多大空間?
今年年初,優(yōu)必選入圍了CB Insights評選出的AI 100榜單,此前在B輪融資中估值已經(jīng)超過10億美金的優(yōu)必選也成為了榜單上智能人形機器人領(lǐng)域的唯一一家獨角獸。
作為行業(yè)中的佼佼者,周劍認為目前國內(nèi)無論是人工智能還是機器人行業(yè),泡沫都非常大。比如,對于家庭場景下的服務(wù)機器人,能做的可能只有三點:教育、陪伴和娛樂,但很多人都在往風(fēng)口上沖,其實是自己根本沒想好自己能做什么。
周劍還認為,蘋果、谷歌這類巨頭進入智能機器人領(lǐng)域的可能性不大。
“其實我和蘋果、BAT都接觸過。第一,每家公司有自己的基因,有自己的主業(yè)。我們現(xiàn)在全力以赴在做的東西它們應(yīng)該不會去做;第二,沒有硬件的操作系統(tǒng)并不是一個完整的操作系統(tǒng),這跟簡單地將一個開發(fā)好的Alexa平臺放在不同的硬件上,是完全不同的兩碼事情?!?BR> 周劍說,自己一直在做幾乎沒別人在做的事情,也許未來的機器人操作系統(tǒng)會有好幾種,但在人形機器人這樣一種載體上,優(yōu)必選在未來完全有機會脫穎而出。他還表示中國的強大智能制造業(yè)實力有機會將這一行業(yè)的邊界拓展到更遠。
未來
未來,人形機器人是否會是通用人工智能的最終載體?
周劍說,就他個人而言,更偏愛人形機器人這種形態(tài),也希望它能夠成為這樣一種載體,特別是在家庭領(lǐng)域——不管它需要十年、三十年還是一百年來實現(xiàn)。他仍然相信,在未來無論家中的硬件如何智能,人仍然會感到孤獨,會需要陪伴,而他希望人形機器人能扮演這種角色。
而陶大程則給出了一個更為客觀的回答:“我覺得人形機器人主要是用來完成和人之間的交互,但在一個工廠中,真的一定需要人形機器人來完成工作嗎?并不是所有場景都需要人形機器人的參與?!?BR>陶大程表示,人工智能已經(jīng)遍及生活的各個角落,其表現(xiàn)形式可以是多種多樣的。但對于人與機器人之間的交互而言,人形機器人在未來應(yīng)該會是AI的主要載體。
“就像我們誰也不愿意對著一個智能音箱說話——但如果是和一個人形機器人說話,感覺到理解和陪伴,你可能會覺得更為自然?!碧沾蟪陶f。
One More Thing
附送一個視頻。畫面中正在行走的是優(yōu)必選正在開發(fā)的雙足機器人Walker(目前還只是一個骨架),研發(fā)團隊目前正在對其進行測試,最早有望在明年的CES大會上亮相。
周劍透露,Walker的預(yù)估研發(fā)成本在3到5億人民幣之間。
P.S.就在昨天,Google將全球最知名的機器人公司波士頓動力出售給軟銀。優(yōu)必選相關(guān)負責(zé)人應(yīng)量子位之約,從他們的角度解讀這一事件:
波士頓動力在機器人行業(yè)是一家令人尊敬的公司。
在此之前,波士頓動力曾經(jīng)對外表示過,公司以前是、現(xiàn)在是、且將長期是一個燒錢的公司。不難看出,成本問題制約著機器人商業(yè)化的步伐,尤其人形機器人,目前代表全球最高水平的本田ASIMO和波士頓動力的Atlas機器人,造價百萬美元級,但都處于實驗室階段。作為產(chǎn)品推向市場,其性能是否穩(wěn)定、成本是否可控成為關(guān)鍵因素。全世界目前還沒有任何一家公司能夠?qū)㈦p足機器人商業(yè)化推向市場,歐美、日韓都沒做到。
而優(yōu)必選從誕生之初,就非常明確要做可商業(yè)化的人形服務(wù)機器人,我們一直是“兩條腿走路”,即左腿商業(yè)化,右腿為前沿技術(shù)布局。能夠?qū)⒀芯砍晒杆俎D(zhuǎn)化成產(chǎn)品進行市場化驗證,收集來自用戶的行為反饋,從而為接下來的技術(shù)研發(fā)提供最有價值的數(shù)據(jù)參考。
以Alpha系列為例,它是一款仿人形機器人,機器人分為仿人形、類人形和真人機器人。人形機器人是最為人類接受以及最適應(yīng)人類生活及情感的形態(tài),而人形機器人是家庭服務(wù)機器人的最終目標(biāo),真人機器人至少需要30年才能真正實現(xiàn)商業(yè)化,但是從短期內(nèi)來看,5到10年里我們某種程度上的一些仿人形的機器人可能有機會進入家庭,適應(yīng)人類生活環(huán)境,成為主動式交互中心。
被日本軟銀收購之后,希望看到波士頓動力在機器人商業(yè)化方面加速進程,有更多的產(chǎn)品創(chuàng)新和技術(shù)突破,對全球機器人行業(yè)以及未來人工智能的發(fā)展創(chuàng)造革命性的價值。
2023-03-13 14:52
2023-03-13 09:15
2023-03-09 08:45
2023-03-08 09:33
2023-03-08 09:15
2023-03-07 09:09
2023-03-06 08:29
2023-02-28 16:45
2023-02-27 11:33