2017中國國際機(jī)器人產(chǎn)業(yè)發(fā)展高峰論壇匯聚了機(jī)器人行業(yè)中的專家、大咖以及行業(yè)領(lǐng)頭企業(yè),打造一場引來全球機(jī)器人同仁關(guān)注焦點(diǎn)的盛事。
科沃斯機(jī)器人股份有限公司董事長錢東奇先生跟大家分享一下關(guān)于服務(wù)機(jī)器人這方面的商業(yè)化的實(shí)踐和思考。
科沃斯機(jī)器人股份有限公司董事長錢東奇先生
大家下午好,很高興今天受大會主辦方的邀請來跟大家分享一下關(guān)于服務(wù)機(jī)器人這方面的商業(yè)化的實(shí)踐和思考,其實(shí)我這個(gè)報(bào)告可能是兩個(gè)特點(diǎn),第一個(gè)特點(diǎn)就是他的視角是比較微觀,我們希望大家能夠通過微觀去看宏觀的界面,另外一個(gè)特點(diǎn),其實(shí)很多的觀點(diǎn)是來自于我們自己企業(yè)實(shí)踐當(dāng)中的案例,我們也希望大家有機(jī)會通過我們企業(yè)的實(shí)踐生動的內(nèi)容來看整個(gè)服務(wù)機(jī)器人的行業(yè)的發(fā)展。
其實(shí)今天我們這個(gè)大會在座的更多的是工業(yè)類機(jī)器人,那我們服務(wù)機(jī)器人在談這個(gè)問題的時(shí)候可能就是給大家有一個(gè),像一個(gè)佐料一樣的,有一個(gè)調(diào)料,我們看一下,講到服務(wù)機(jī)器人,其實(shí)服務(wù)機(jī)器人在和工業(yè)機(jī)器人的差異,如果講一個(gè)大概念,其實(shí)工業(yè)機(jī)器人在很多情況下面對的是物,但服務(wù)機(jī)器人很多情況下面對的就是人,那我們看看,其實(shí)我們首先講什么是機(jī)器人,這個(gè)東西其實(shí)在我們服務(wù)機(jī)器人里面,其實(shí)還是有不同的看法的,在我們看來,站立再生我的角度去看機(jī)器人,首先你要有一個(gè)大腦,然后接下來你得對外部有一個(gè)感知,你如果是作為一個(gè)機(jī)器人,你應(yīng)該有一個(gè)感知,我們就講剛才講就有很多的傳感器,去了解外部,那重要的一點(diǎn),其實(shí)在我們服務(wù)機(jī)器人界里面很多人做機(jī)器人做到這一塊的時(shí)候,也把它作為談成是機(jī)器人,就這么一個(gè)人形,也不動,但是他會跟你說話,有一些交互,我們也把它看成是機(jī)器人,但是站在我的角度來說,機(jī)器人還有另外一個(gè)特點(diǎn),就是Mobilty,如果沒有這樣一個(gè)特點(diǎn),我們簡單的把它說成機(jī)器人,我認(rèn)為還是相對于我們的功能上面來說是有缺失的,那如果說這樣一個(gè)總體上面來定義,我們把它定義成機(jī)器人,在我們工業(yè)領(lǐng)域里面,比如說我們的機(jī)器手,就是符合了這些基本的條件,但是在服務(wù)機(jī)器人里面,其實(shí)即使到今天我們講機(jī)器人也可以這樣去看,我們把剛才的點(diǎn)用這張圖表達(dá)的時(shí)候,那就是決策力我們講就是他的大腦,從傳統(tǒng)意義的機(jī)器人我們看機(jī)器人的時(shí)候,其實(shí)他的決策力是來自于我們?nèi)耍褪枪こ處熃o他做了相應(yīng)的編程,以至于這樣的編程,也就是他的后端的大腦是由預(yù)編程做進(jìn)去的,這樣的機(jī)器人我們認(rèn)為他是一個(gè)傳統(tǒng)意義上的機(jī)器人,當(dāng)然我們理解這個(gè)東西的時(shí)候,我們可能去說他是不是要變成一個(gè)人形,我覺得完全未必。
前幾天馬云在天津智能大會上面有一個(gè)講話,他也談到他的觀點(diǎn),他覺得我們在今天的人工智能時(shí)代的時(shí)候,太多的人去模仿人來去做這樣的工作,其實(shí)我們在今天這個(gè)時(shí)代,需要的是怎樣把智能更多的去為人服務(wù),而不至于就單一的模仿人,從這個(gè)角度上面來說,我覺得我還是非常認(rèn)同這個(gè)觀點(diǎn)的,我們的科技最終怎樣去解決的是怎樣去把它可以用來為人做服務(wù),或者去做人不能做的事,或者去做人不愿意做的事,如果是這樣去做,那我們覺得我們的科技也好、商業(yè)也好,是有價(jià)值的。
反過來,如果是從這樣一個(gè)概念去做,比如說像科沃斯目前做的,我們現(xiàn)在對應(yīng)的服務(wù)機(jī)器人就是兩個(gè)系列,一個(gè)就是家用的,比如說清潔地面的、擦窗戶的,機(jī)器人做空氣凈化的,機(jī)器人的移動空氣凈化,智能移動,以及管家,那商業(yè)用的比如清潔太陽能板的或者在銀行或者商場去做接待的,這一類的機(jī)器人在很多情況下未必是人形,但是他可以滿足剛才那樣的基本條件,然后也可以在商業(yè)上面產(chǎn)生對應(yīng)的能夠輔助人,或者人不愿意做的事,由他來做,當(dāng)然我們講的現(xiàn)在的這樣機(jī)器人,其中有一個(gè)特點(diǎn)就是他的智能是人工預(yù)編程的,盡管有對應(yīng)的傳感器,有對應(yīng)的移動能力,但是他所有的移動行為所有的感知行為感知以后,他是有一個(gè)人工預(yù)編程指令的行動,那么在我們對應(yīng)的嵌入式系統(tǒng)里面加進(jìn)去,才去完成相應(yīng)的工作。
這樣的話,其實(shí)像這一類的機(jī)器人,我們統(tǒng)稱為工具,完成單一任務(wù),當(dāng)然現(xiàn)在也有完成,就在這個(gè)基礎(chǔ)上完成多重任務(wù)的,比如說像我們的管家機(jī)器人,管家機(jī)器人他就是完成不是單一的任務(wù),他不僅僅是可以清潔地面,他也可以進(jìn)行模塊化組合,更重要的是借助信息化體系,比如物聯(lián)網(wǎng)和互聯(lián)網(wǎng),這樣的信息化體系,以至于他在家里面不僅僅是完成比如說一個(gè)清潔地面工作,甚至于把你的家庭也管起來,他完成這樣的多重任務(wù),那么管家庭的時(shí)候,他可以比如說定點(diǎn)巡邏,在家里面定點(diǎn)巡邏,和手機(jī)連接起來以后,你可以定時(shí)看到家里面的狀況,那你可以就是去做安防,和物聯(lián)網(wǎng)連接起來以后定期的,就家里面比如說有陌生人來了,窗戶被打開了等等等等,那么這個(gè)他有反饋以后,他也可以到現(xiàn)場去取證,再發(fā)到你的手機(jī)里面,跟你完全連接起來,甚至于你的 老人在家里面臥室里面,你的小孩在兒童房里面,那么他怎樣定期的到臥室里面提醒老人起來鍛煉,到兒童房里面看一看小孩有沒有做作業(yè),跟小孩交流互動一下,有情況跟家長連接,比如用手機(jī)連接,這一類的功能模塊是從單一的工具進(jìn)入到管家,但即使是這樣的一個(gè)管家模塊,最大的特點(diǎn)并不具備自己的智能,他還是有人工在做預(yù)編程的。
其實(shí)說明了他的人工預(yù)編程管家機(jī)器人,這是管家機(jī)器人把家里面的圖畫出來了,這是一個(gè)手機(jī)界面,就這樣一個(gè)手機(jī)界面用戶可以給機(jī)器人做定義,幾點(diǎn)到這來,做什么事,幾點(diǎn)到這來,比如說提醒老人吃藥,幾點(diǎn)到這來,就用這個(gè)手機(jī)界面提醒小孩怎樣,或者幾點(diǎn)在家里做一次巡邏,把家里巡邏的情況反饋給主人,所有的這些工作盡管作為一個(gè)機(jī)器人把家里面的圖畫出來了,但是最終指令機(jī)器人做哪些工作,還是通過這個(gè)手機(jī)界面人工把它定義下去,這個(gè)管家基于什么技術(shù)來做這件事呢,基于的是信息化的技術(shù),就是我們剛才講的,就是人工編程技術(shù)只能是一個(gè)自動化的技術(shù),但是我剛才講的,剛才的管家的這些功能以后,他是基于了這樣信息化的技術(shù),人和機(jī)器可以連接,機(jī)器和物可以連接,也就是物聯(lián)網(wǎng)的技術(shù)和移動互聯(lián)的技術(shù)使我們的產(chǎn)品有更多的功能可以展現(xiàn)出來,所以這是基于信息化的技術(shù),當(dāng)然通過信息化有了巨大的數(shù)據(jù),同時(shí)由于摩爾定律使得我們的運(yùn)算能力成倍增長,那我們過去剛剛專家也談到了,從50年代開始研究人工智能,所以這一部分的認(rèn)知技術(shù)總體上面這三個(gè)條件融合起來以后,那么最終應(yīng)該我們的服務(wù)機(jī)器人也會走到下一個(gè)階段,那么這個(gè)下一個(gè)階段呢我們叫做AI機(jī)器人。
其實(shí)這個(gè)階段我們認(rèn)為已經(jīng)開始到來了,那這樣一個(gè)階段它的感知能力、認(rèn)知能力、決策能力、行動能力它這樣的綜合能力的特別是它的認(rèn)知能力,它并不是由人工預(yù)編程做進(jìn)去的,而是通過它的機(jī)器學(xué)習(xí)這樣的一種能力,它對環(huán)境的了解和環(huán)境的認(rèn)知,最后來形成它自己的這種行為模式和自己的這種反饋模式,那么這樣的機(jī)器人我們講在過去的服務(wù)機(jī)器人的情況下,我們將會走入下一階段,也就是AI的服務(wù)機(jī)器人。
AI的服務(wù)機(jī)器人我們談這個(gè)事,我們就是至少要在現(xiàn)階段,AI服務(wù)機(jī)器人首先認(rèn)知能力是來自于AI,但是我們現(xiàn)階段的AI總是有兩類,一類就是基礎(chǔ)資源,比如說像我們目前谷歌特別是谷歌,它在開源的很多的基礎(chǔ)的應(yīng)用,以及大量的數(shù)據(jù),這樣的一些基礎(chǔ)的資源是一個(gè)廣義上的能力,但是怎樣把廣義上的能力變成在商業(yè)應(yīng)用上垂直應(yīng)用的能力,那么這個(gè)其實(shí)在下一階段我們做服務(wù)機(jī)器人當(dāng)中的其中一個(gè)很關(guān)鍵的要走掉的一步,這樣的一個(gè)服務(wù)機(jī)器人的能力,它又來自于對于垂直場景的數(shù)據(jù),以及對垂直場景的業(yè)務(wù)的理解,所以未來的機(jī)器人在很大情況下,如果說你是一個(gè)AI機(jī)器人,你一定是一個(gè)非常垂直場景的功能的機(jī)器人,你沒有辦法作為一個(gè)寬泛AI的機(jī)器人,那可能是下一段階段強(qiáng)人工智能出來的時(shí)候,今天這個(gè)階段還是弱人工智能,所以在垂直場景里面的機(jī)器人,所以未來的機(jī)器人他可能會,比如說這是法務(wù)機(jī)器人,這是商業(yè)導(dǎo)購機(jī)器人,這是銀行接待機(jī)器人,就是不同的領(lǐng)域,這是醫(yī)療,而且醫(yī)療里面也會細(xì)分,這是由于場景和細(xì)分?jǐn)?shù)據(jù)的細(xì)分帶來這方面的細(xì)分,最后形成的這樣的一些,就是有效的商業(yè)應(yīng)用。
那我們就講這個(gè)人工智能和機(jī)器學(xué)習(xí)對于AI來說,從哪兩個(gè)方面來去引導(dǎo)整個(gè)機(jī)器人的推進(jìn)呢,一個(gè)方面其實(shí)是計(jì)算機(jī)模式識別,人工智能在這個(gè)領(lǐng)域里面其實(shí)拓展的速度最快最有效的,計(jì)算機(jī)模式識別呢,我們廣義的模式識別可能就落到非常垂直領(lǐng)域里面的特定場景的物體識別,比如說舉個(gè)例子,一個(gè)家庭,一個(gè)家庭就是桌子、椅子、床、抽水馬桶、冰箱、彩電,都是特定場景的特定內(nèi)容的物體識別,第二個(gè)就是功能區(qū)域的分隔,我們在前端已經(jīng)看到了,我剛才舉的管家的例子,一張地圖出來以后,功能區(qū)域的分隔由人為做定義,比如幾點(diǎn)到這,幾點(diǎn)到這來,但是未來功能區(qū)域的分隔是由機(jī)器人自己在家里面轉(zhuǎn)一圈以后它完全就了解了,這個(gè)區(qū)域是干什么的,這是不需要人為去定義的,由這樣的自主學(xué)習(xí)來完成的。
未來機(jī)器人在特定場景里面,他把這個(gè)地方他應(yīng)該在這個(gè)位置關(guān)系應(yīng)該做什么,怎么做,基本上是機(jī)器人來去做基本的定義,當(dāng)然他和人之間是不是也要交互呢,這是必然的,因?yàn)樗麨槿朔?wù),這種交互是必然的。
剛才舉的例子,交互是用手機(jī)來去做交互的,但是未來的交互是用語言,我跟機(jī)器人說話,告訴你,你應(yīng)該幾點(diǎn)去干什么,到哪里去干,那么這個(gè)哪里其實(shí)機(jī)器人自己事先就認(rèn)知了解,所以從這個(gè)角度上面來說,未來的機(jī)器人在用戶的體驗(yàn)當(dāng)中和我們過去的用戶體驗(yàn)是完全不一樣的,而且干完了以后和用戶去反饋,這個(gè)反饋過程也是他的學(xué)習(xí)過程,他通過這樣的學(xué)習(xí)來認(rèn)知了解這件事到底怎樣來做,這就是未來機(jī)器人它的特征,甚至于它對于語義的認(rèn)知直接左右了它的動作行為,機(jī)器人和一般的人工智能或者一般的被動的自動化,就這一部分機(jī)器人最大的能力是他的學(xué)習(xí)力和他的行為模式是基于這樣的學(xué)習(xí)和認(rèn)知了解形成的,所以這個(gè)是一個(gè)最大的差異。
這個(gè)地方講的,我們剛才講的是家用機(jī)器人的演變,那么商用機(jī)器人其實(shí)是一個(gè)道理,科沃斯其實(shí)在商用機(jī)器人也有對應(yīng)的時(shí)點(diǎn),我們最早做的旺寶機(jī)器人,這是第一代,第一代的機(jī)器人其實(shí)Moblit是運(yùn)動,但背后的大腦其實(shí)就是后臺的人,是由遠(yuǎn)程來控制的一個(gè)后臺的人,我們可能很多人知道嬌嬌,其實(shí)它前身就是這個(gè)旺寶,這個(gè)演變其實(shí)這個(gè)過程的演變并不是說我們一開始機(jī)器人就有這樣的交互能力服務(wù)我們的人,后臺有一個(gè)基本的支撐,這樣演變過程當(dāng)中我們有旺寶二代,到今天也發(fā)了旺寶三代,旺寶第三代就和旺寶的一代最大差異就是這個(gè)交互和大腦就不僅僅是后臺的單純的人,還有自己的自主的部分,比如說語音語義理解,對環(huán)境的識別,對場景的識別,所有的這一切都是基于未來人工智能需求做布局的。
當(dāng)然這個(gè)過程其實(shí)我們看到這個(gè)旺寶一代的時(shí)候,剛才介紹了,它其實(shí)就是一個(gè)簡單的后臺機(jī)器人,作為一個(gè)前端的服務(wù),作為客戶的興趣掃碼,他其實(shí)是這樣一個(gè)過程,就是說云端后臺人到旺寶,形成這樣的基礎(chǔ)技術(shù)架構(gòu),到了旺寶二代的時(shí)候,其實(shí)這個(gè)模塊就發(fā)生了變化,除了旺寶一代的基本功能之外,他就有語音識別圖像識別,人臉識別,這樣的基本功能,到了旺寶三代的時(shí)候,在旺寶一代相對于二代的商業(yè)上面的提升,其實(shí)是顯而易見的,其實(shí)旺寶一代的時(shí)候人到這個(gè)地方服務(wù),是一對一的,到了旺寶二代的時(shí)候服務(wù)效率就有了明顯的提升,這都是因?yàn)橛辛思夹g(shù)的往前面的,剛才講的技術(shù)的應(yīng)用,到了旺寶三代就是人工智能的機(jī)器人的工作場景,適合更大面積商場環(huán)境的機(jī)器人運(yùn)動平臺,比如我們想像一個(gè)場景,你到商場去買東西,其實(shí)你并不知道在商場里面哪一個(gè)地方賣什么,我們過去的方法是在一個(gè)屏上面去找這張地圖在哪里,但未來人們就有機(jī)會看到很多的機(jī)器人在商場那就是作為一個(gè)接待人員,跟你交流就是看你想買什么,他會把你帶到那個(gè)地方去,告訴你在這個(gè)地方,而且在這個(gè)過程當(dāng)中你甚至于可以跟他去了解認(rèn)知,這個(gè)里面的商品的情況怎樣,因?yàn)樗幸粋€(gè)巨大的商品的知識庫,甚至于他知道你上一次到這來買過,你的喜好是什么,那將來應(yīng)該為你推薦什么,這都是未來,我就講一個(gè)商業(yè)場景的應(yīng)用,就具備這樣的能力,所有這些能力他是由自動化信息化最后跳到人工智能帶來的一個(gè)變化。
這個(gè)也就是我剛才講的,就是旺寶的基本應(yīng)用,包括商場,比如圖書館,你要借一本書,但是你自助去拿這本書的時(shí)候,可能都在旺寶數(shù)據(jù)庫里面,他可能到那告訴你這本書就在這等等。
總體上面來說,通過剛才的介紹,由于技術(shù)的演進(jìn),家用機(jī)器人而言,最早是一個(gè)工具,可以幫你完成某一項(xiàng)特定的任務(wù),這個(gè)我們有人工預(yù)編程進(jìn)去做到,接下來就會變成一個(gè)管家,可以完成多重任務(wù),但是未來的機(jī)器人一定就是一個(gè)伴侶,什么叫伴侶,他不但可以完成任務(wù),他可以和你交互,通過這樣的交互,能夠認(rèn)識你了解你,怎樣去做到讓你開心讓你更樂意去做愿意做的事,幫你疏解解悶等等等等,這個(gè)就叫伴侶,所以自動化的技術(shù)這樣我們就形成了工具,自動化加信息化,再加弱人工智能,這樣我們就是形成了我們的管家,當(dāng)然未來可能我們有強(qiáng)人工智能,到了那個(gè)階段那我們自然就會形成這樣的一個(gè)伴侶,對于商用級的機(jī)器人,仍然也有一個(gè)路線圖,我們最早看到的就是助手,再往下可能是你的工作伙伴,你的某些工作幫你去做掉,然后再往下去,可能就是一個(gè)行業(yè)專家,在很多有智慧的部分,他可能做的比你還強(qiáng),那我們講人干嗎呢,這些人的工作都沒有了嗎,至少在這樣的一個(gè)線路圖里面,至少我可以在這個(gè)地方看到兩樣工作,未來是新的,兩樣學(xué)術(shù)未來是新的,那就是什么呢,就是叫VUI、BUI,VUI就是說機(jī)器人和人互動的時(shí)候他是用什么樣的對話場景,用什么樣的對話方式,人更容易進(jìn)入場景,機(jī)器人更容易理解人,我覺得這個(gè)是通過這樣的一種交互界面來形成的,而這種交互界面很有可能就是現(xiàn)在的語音語義理解對句子對場景有很多的內(nèi)容要去做很深度的研究,通過這種交互方式來簡化這樣的工作,以至于人更適應(yīng)于和機(jī)器人交互,這個(gè)將來可能就是一門學(xué)問,有很多的工程師去做這件事。
還有一種模式呢,我們叫做BUI,是指什么呢,就是說機(jī)器人是可以行動的,但是機(jī)器人的行為模式,什么樣的行為模式對人來說他的界面交互是最好的,最容易接受的,最友善的,因?yàn)槲覀儸F(xiàn)在很多行為模式就是工程師做的,就是把這個(gè)功能完成,但是如果說將來的交互這種行為模式他就是一個(gè)很好的,怎樣去把機(jī)器人的界面變的和人之間更友善,哪怕你是一個(gè)人形的,還是一個(gè)動物形的,或者還是四個(gè)爪子還是八只手等等,都有對應(yīng)的行為模式,這種行為模式最后還是最終要被人去接受的,所以總體來說,我們在這看到,從我們科沃斯機(jī)器人理解的和人之間打交道的服務(wù)類機(jī)器人,無論是從家庭的還是從商業(yè)的使用,那么整個(gè)的,從微觀角度上面去看的方向,那么在這跟大家做一個(gè)分享,希望能夠拋磚引玉,謝謝大家。
2024-10-21 14:35
2024-10-21 09:45
2024-10-21 08:27
2024-10-16 11:29
2024-10-14 09:19
2024-10-13 12:05
2024-10-11 11:57
2024-10-10 10:00
2024-10-09 10:05