7月29日,小鵬汽車(chē)首席科學(xué)家郭彥東博士出席鈦媒體2018科技生活節(jié),以“造更懂中國(guó)人的AI Car”為主題做演講,他提出:“在車(chē)和人互動(dòng)的過(guò)程中,AI的應(yīng)用能讓車(chē)去更好的識(shí)別和理解人,從而提升用戶體驗(yàn)及車(chē)輛安全性。小鵬汽車(chē)不僅要更懂路上的中國(guó)人、還要更懂車(chē)?yán)锏闹袊?guó)人。”
小鵬汽車(chē)首席科學(xué)家郭彥東博士演講
以下為郭彥東博士演講實(shí)錄:
我今天想從小鵬汽車(chē)發(fā)展中的一些思考和努力,跟大家探討一下如何造更懂中國(guó)人的智能汽車(chē)。
什么是更懂中國(guó)人的AI Car?
第一層面,更懂路上的中國(guó)人。
其實(shí)我們路上有這樣那樣的行為,包括開(kāi)遠(yuǎn)光燈也好,有時(shí)候人車(chē)混流也好,需要學(xué)習(xí)的其實(shí)是人的行為,人的文化,也還有人制定的政策和法規(guī)。舉個(gè)例子,在美國(guó)車(chē)跟車(chē)之間的距離是比較遠(yuǎn)的,但在中國(guó)駕駛場(chǎng)景當(dāng)中,在等紅燈的時(shí)候,車(chē)跟車(chē)的距離非常之近,哪怕非常之近的時(shí)候都有車(chē)加塞進(jìn)來(lái),這個(gè)環(huán)境當(dāng)中對(duì)智能的要求,就已經(jīng)超出了普通的物體檢測(cè)提到的要求,智能車(chē)其實(shí)學(xué)的是人的行為、人的文化,學(xué)的是人的政策和法規(guī)。其他幾個(gè)例子包括中文的路牌、中國(guó)特色路牌,包括密集交通、人車(chē)混流,甚至中國(guó)一些特色天氣下的處理,等等都給我們更懂“路上的”中國(guó)人提出一些機(jī)遇和挑戰(zhàn)。
第二層面,更懂車(chē)?yán)锏闹袊?guó)人。
更懂車(chē)?yán)锏闹袊?guó)人,我也把它分這么兩個(gè)層次討論:1、更懂車(chē)?yán)锏闹袊?guó)人,最簡(jiǎn)單的就是要求智能車(chē)聽(tīng)得懂中國(guó)話,認(rèn)得到中國(guó)人,符合中國(guó)的駕駛習(xí)慣。2、“懂你”。“懂你”指的是說(shuō),懂在車(chē)?yán)锏倪@一個(gè)中國(guó)人,這一個(gè)中國(guó)司機(jī)我們要懂他。為了實(shí)現(xiàn)這樣一個(gè)目的,第一我們要人臉識(shí)別,知道開(kāi)車(chē)的是誰(shuí),他有什么樣用戶的畫(huà)像。第二我們需要對(duì)用戶的情緒狀態(tài)有這樣的感知,為什么有這樣的感知呢,情緒信號(hào)其實(shí)是對(duì)我們調(diào)教車(chē)的用戶體驗(yàn)的一個(gè)非常強(qiáng)的信號(hào)。
這個(gè)分享從一個(gè)橘子開(kāi)始,大家在圖上看到,一個(gè)橘子被卡在了方向盤(pán)上面。這其實(shí)是一張?zhí)厮估膱D片,說(shuō)的是,特斯拉的“自動(dòng)駕駛限制”被一顆橘子破解。
我們知道,特斯拉的輔助駕駛系統(tǒng),實(shí)際上要求,司機(jī)必須要手持方向盤(pán)。那么,它是通過(guò)什么來(lái)檢測(cè)司機(jī)是不是手持方向盤(pán)的呢?其實(shí),在特斯拉的方向盤(pán)里面有一個(gè)壓力傳感器。有些用戶不愿意去遵守特斯拉公司這樣的一個(gè)規(guī)定,就把這個(gè)橘子放在方向盤(pán)上面,從而成功的騙過(guò)了特斯拉汽車(chē)。這個(gè)是一個(gè)很小事件,但是我們從這個(gè)橘子上也看到了一些挺有意思的事情。
有很多輔助駕駛功能,都包括車(chē)道線輔助、緊急剎車(chē)、盲點(diǎn)檢測(cè)等等技術(shù),甚至很多都有供應(yīng)商提供了。我們希望能讓人工智能技術(shù)真正提升用戶體驗(yàn)跟車(chē)輛安全性,比如用智能的感知與決策把這些獨(dú)立的輔助駕駛功能有機(jī)結(jié)合起來(lái),這個(gè)車(chē)才是一個(gè)真正的智能車(chē),才能夠提高用戶的體驗(yàn)。我舉幾個(gè)例子,一方面是車(chē)外的一些感知,比如天氣,比如說(shuō)場(chǎng)景的識(shí)別、事件識(shí)別和預(yù)測(cè)。例如,一個(gè)司機(jī)在路上看到一輛校車(chē)停在路邊,車(chē)門(mén)打開(kāi)了,他會(huì)知道可能有小朋友從車(chē)?yán)锱艹鰜?lái)。但是什么時(shí)候我們的輔助駕駛功能車(chē),搭載了智能模塊以后也能做出類似的判斷呢?這才是我們樂(lè)于看到的一個(gè)事情。
另外,我覺(jué)得,跟車(chē)外的一些情況預(yù)測(cè)和判斷、智能感知比起來(lái),車(chē)內(nèi)的感知可能顯得更重要。我舉幾個(gè)例子,包括乘客、司機(jī)的識(shí)別,包括我剛才說(shuō)的注意力、情緒的識(shí)別。我們能不能在人和車(chē)互動(dòng)的過(guò)程中,讓車(chē)去更好的理解司機(jī)的狀態(tài)?不光是他的注意力,包括他的疲勞、情緒,做一個(gè)正向的反饋循環(huán),來(lái)提升用戶的體驗(yàn),這個(gè)是我們的近期愿景。
所以,我們核心就是要把這些功能智能化,然后提升用戶體驗(yàn)。它的基礎(chǔ)就是智能感知。
三大維度構(gòu)建小鵬AI Car
我想和大家分享一下,我們小鵬汽車(chē)是怎樣實(shí)現(xiàn)這個(gè)愿景的。我們有三大模塊,第一是大數(shù)據(jù),我們的智能車(chē),始于大數(shù)據(jù),訓(xùn)練和優(yōu)化在人工智能訓(xùn)練平臺(tái)上,成熟在量產(chǎn)車(chē)平臺(tái)。量產(chǎn)車(chē)平臺(tái)是我們作為整車(chē)廠商一個(gè)獨(dú)特的優(yōu)勢(shì),我們OTA最新的算法模型在量產(chǎn)車(chē)上,然后我們?cè)購(gòu)牧慨a(chǎn)車(chē)?yán)锩媸占?、采集更多的中?guó)用戶真實(shí)數(shù)據(jù),來(lái)完成這樣一個(gè)閉環(huán)迭代的過(guò)程。
我從數(shù)據(jù)、人工智能平臺(tái)、量產(chǎn)車(chē)從這三個(gè)方面,來(lái)跟大家分別探討一下。
第一,數(shù)據(jù)為王。
小鵬汽車(chē)作為整車(chē)廠商,作為一個(gè)真正做量產(chǎn)車(chē)產(chǎn)品的公司,我們最關(guān)心的、最重視的就是我們的數(shù)據(jù)。我們的數(shù)據(jù)來(lái)自于下面4個(gè)主要的來(lái)源:互聯(lián)網(wǎng)大數(shù)據(jù)、仿真大數(shù)據(jù)、自有車(chē)隊(duì)或者測(cè)試車(chē)隊(duì)大數(shù)據(jù)、中國(guó)真實(shí)用戶大數(shù)據(jù)。
我主要說(shuō)一下互聯(lián)網(wǎng)大數(shù)據(jù)和中國(guó)真實(shí)用戶的大數(shù)據(jù)。一是互聯(lián)網(wǎng)大數(shù)據(jù)。最近這20年,整個(gè)人類其實(shí)做了一件很有意義的事情,就是把他們的行為、信息、知識(shí)都做了互聯(lián)網(wǎng)化。我們現(xiàn)在想要找一些信息,在互聯(lián)網(wǎng)上直接做簡(jiǎn)單的搜索就可以馬上得到,是因?yàn)槲覀兇罅康娜祟愋畔⒍家呀?jīng)在互聯(lián)網(wǎng)上有所體現(xiàn)了,都已經(jīng)在互聯(lián)網(wǎng)上被數(shù)字化了。我可以和大家分享一個(gè)更細(xì)節(jié)的數(shù)字,我們也跟很多技術(shù)供應(yīng)商去探討,一些很頂級(jí)的技術(shù)供應(yīng)商,可能一年收集10個(gè)億的圖片,但是這個(gè)圖片的量對(duì)于互聯(lián)網(wǎng)數(shù)據(jù)來(lái)說(shuō),可能是一周,甚至遠(yuǎn)遠(yuǎn)不到一周的時(shí)候,互聯(lián)網(wǎng)上就有這么多圖片產(chǎn)生了。這個(gè)做過(guò)搜索引擎的人最有體會(huì)的,包括我自己?;ヂ?lián)網(wǎng)數(shù)據(jù)量非常之大,對(duì)早期算法的演進(jìn)意義重大。但是它有它的挑戰(zhàn),就是說(shuō),這部分?jǐn)?shù)據(jù)可能跟無(wú)人駕駛、智能車(chē)想要的數(shù)據(jù)分布有一些不一樣的地方,標(biāo)注也有一些困難,需要用一些辦法,比如遷移學(xué)習(xí)把互聯(lián)網(wǎng)的知識(shí)轉(zhuǎn)移到智能車(chē)上去。為了達(dá)到這樣的一個(gè)目的,我們也關(guān)注另外3個(gè)主要數(shù)據(jù)來(lái)源:1、仿真大數(shù)據(jù)。2、自有車(chē)隊(duì)數(shù)據(jù)。3、來(lái)自于用戶的真實(shí)數(shù)據(jù)。
尤其是中國(guó)用戶的真實(shí)數(shù)據(jù),不管從真實(shí)度上,還是成本效率上,還是對(duì)場(chǎng)景的覆蓋度、數(shù)據(jù)量上,都遠(yuǎn)遠(yuǎn)的優(yōu)于仿真和自有車(chē)隊(duì)的數(shù)據(jù)體量。在人工智能尤其是深度學(xué)習(xí)的大環(huán)境下,其實(shí)誰(shuí)坐擁了數(shù)據(jù),誰(shuí)就有可能會(huì)有最先進(jìn)、最完善的技術(shù)體系。這也是整車(chē)廠商有的一個(gè)優(yōu)勢(shì)。我們從大量的用戶中搜集用戶的反饋,用這個(gè)數(shù)據(jù)不停的調(diào)教和更新我們的智能車(chē)系統(tǒng)。
第二,我們有了數(shù)據(jù)以后,如何去做。我們搭建人工智能平臺(tái),用大量的數(shù)據(jù)訓(xùn)練多個(gè)深度學(xué)習(xí)模型。
但是,我們想強(qiáng)調(diào)的是在智能車(chē)的場(chǎng)景中,往往最有價(jià)值的就是所謂的長(zhǎng)尾(long-tail)數(shù)據(jù)。就是說(shuō)這些數(shù)據(jù)發(fā)生的頻次很低,很有可能你開(kāi)很久的車(chē)才會(huì)有一次、兩次發(fā)生,但是這些事情的種類、類別、數(shù)量會(huì)非常多,想要讓我們的車(chē)輛適應(yīng)盡可能多的場(chǎng)景,就要求我們的人工智能平臺(tái)有快速處理這樣一個(gè)長(zhǎng)尾(long-tail)數(shù)據(jù)的能力。
這有幾個(gè)挺有意思的例子,比如我從加州回來(lái)之前在路上。因?yàn)樘鞖庖埠芎?,前面是一個(gè)油罐車(chē),這個(gè)油罐車(chē)很干凈,它把后面的車(chē),包括我自己的車(chē)倒影在油罐車(chē)的油罐上面去了。
如果你對(duì)這個(gè)場(chǎng)景沒(méi)有一個(gè)特殊的理解和處理的話,很多世界上最好的計(jì)算機(jī)視覺(jué)算法,都有可能誤認(rèn)為倒影是真實(shí)的車(chē)道線與車(chē)輛。特斯拉曾經(jīng)發(fā)生過(guò)一件很慘痛的事故,特斯拉的車(chē)沒(méi)有成功的把一輛白色的大貨車(chē)認(rèn)成車(chē),認(rèn)為是一片云彩,也撞上去了。
還有一個(gè)案例,下面這張圖其實(shí)是一個(gè)披著cosplay衣服的行人走在路上,人類司機(jī)都可以完成識(shí)別是一個(gè)行人。但是計(jì)算機(jī)視覺(jué),由于這個(gè)人穿了一件cosplay的衣服,可能算法不一定能成功檢測(cè)到是一個(gè)人。
這就對(duì)我們?nèi)斯ぶ悄軐W(xué)習(xí)平臺(tái)提出的問(wèn)題——當(dāng)樣本不是那么常見(jiàn)、頻次很低的時(shí)候,如何快速學(xué)習(xí)呢?其實(shí)在業(yè)界有很多這種類似的方法、技術(shù)已經(jīng)被研發(fā)出來(lái)了,比如微軟的custom vision,我本人也曾參加了custom vision的核心研究工作。將來(lái)也會(huì)針對(duì)小鵬汽車(chē)的特殊場(chǎng)景定制和打造可以快速迭代,應(yīng)對(duì)小樣本學(xué)習(xí)的人工智能學(xué)習(xí)平臺(tái)。
第三、我們有了數(shù)據(jù),有了人工智能訓(xùn)練平臺(tái),還需要有一個(gè)獨(dú)特的場(chǎng)景,就是量產(chǎn)車(chē)場(chǎng)景。首先小鵬汽車(chē)有一個(gè)全球化的企業(yè)布局,在硅谷、廣州、北京、上海、肇慶、鄭州等地方都有研發(fā)和生產(chǎn)中心,在單車(chē)研發(fā)上投入很多。此外,我們現(xiàn)在也跟世界上最好的芯片廠商有緊密的合作,也簽署了戰(zhàn)略合作協(xié)議,我們將會(huì)搭載世界上算力最強(qiáng)的人工智能芯片之一,這樣也保證我們最新的算法能夠在車(chē)上跑起來(lái),能夠把用戶的一些行為能夠?qū)崟r(shí)的反饋回來(lái)。
小鵬汽車(chē)有了這樣一個(gè)閉環(huán)的智能進(jìn)化能力之后,就可以做到人車(chē)共存,不僅車(chē)會(huì)更懂路上的中國(guó)人,還會(huì)更懂車(chē)?yán)锏闹袊?guó)人。 |