AI系列之自動駕駛(三):“解剖”汽車的“感官系統(tǒng)”
汽車要依靠傳感器來感知周遭的環(huán)境變化,各種類型的傳感器由于其屬性以及技術(shù)原理的不同,各有各擅長的應(yīng)用場景,發(fā)揮著其他的傳感器不具備的作用。
想象一下:此刻地你正行走于繁華的鬧市之中,穿梭于往來的人群之間,你隨著人流而動,向著你想要到達(dá)的某座商場而出發(fā)。
你的大腦飛速的運(yùn)轉(zhuǎn),盡管你絲毫沒有意識到海量的數(shù)據(jù)流經(jīng)由感官,源源不斷地匯集到你的大腦,并在其中進(jìn)行某種計算形成“思考”這一行為概念。
轉(zhuǎn)瞬后,“沿著哪條路走比較近?”、“乘坐哪種交通工具會更加快捷?”、“怎樣規(guī)劃,可以順道路過你想要品嘗的小吃店,去犒賞一下自己的辛勞?”,這些即刻浮現(xiàn)在你的腦海,很快你便會從各種備選方案中找出你認(rèn)為最優(yōu)的路徑方案。
你沒有特別的去注意,但是你可以輕而易舉的在擁擠的人群中來去自如,靈巧地避過前后左右所有你想避開的人和物,抵達(dá)你想要到達(dá)的地方。
因為你的眼睛為你掃描了周邊的一切環(huán)境,它在第一時間向你的大腦反饋:你處于什么位置?你的周遭都有哪些事物?沖你來的電動車速度有多快?旁邊的人是步行還是快跑,腳下是否有臺階或者障礙物?
你在一瞬間得到了一切的反饋。于是你停下腳步,側(cè)著身子給飛馳的電動車讓了些許空間,以便于它能夠順利通過,也使得你自己可以規(guī)避被撞的危險。
而后你加快了腳步超過了旁邊的小伙子,因為他看著手機(jī)放慢的腳步阻礙了你前行的方向。
不遠(yuǎn)處向下的階梯映入眼簾,你知道你需要放慢腳步小心的走下,使得你不至于踉蹌而倒。
耳邊突然傳來一陣熟悉的呼喊,你在一瞬間辨別出來那是友人的聲色,于是你抬起頭望向聲音傳來的方向,看到了馬路對面正在招手的她。并且,左右傳來的汽笛聲又使得你不得不左右環(huán)視確認(rèn)安全后,才放心通過前方的路口。
你的鼻子聞到了一陣“飄香”,于是你抬頭“虎視”四方,眼睛又讓你找到了那家長沙臭豆腐,于是你帶著友人去饕餮了一番。
最后,此行的目的地,你皮笑肉不笑地帶著友人走進(jìn)了一家高檔商場,因為你的心反饋出一個信息——你要出血了,所以它也在滴血。
在此行程中,你的眼睛為你提供了實時的環(huán)境信息,包括:一切周遭實物的掃描,自身位置的定位,物體識別,以及周遭物體潛在移動方向及速度的測算。
就在那一剎那,你的大腦完成了一切的計算,并通過日常的所見你的大腦繪制并存儲了這一代地方的高清地圖。而你的耳朵,為你提供了所處位置周邊物體所產(chǎn)生的一切聲音反饋,并且可以對某條聲色進(jìn)行準(zhǔn)確接收和識別,還可以根據(jù)聲音的大小判斷物體距離的遠(yuǎn)近,從而實現(xiàn)測距和預(yù)警功能。
眼睛、耳朵、鼻子、肢體甚至于你的皮膚,無時無刻不在與現(xiàn)實世界進(jìn)行著的交互行為,及其敏銳地搜取著所有的體外信息。
現(xiàn)實世界通過你的這些外設(shè)“傳感器”,為你提供可以描繪體外環(huán)境信息的數(shù)據(jù)流。
你的身體通過對于各部位匯集的數(shù)據(jù)流進(jìn)行快速分析,并完成信息解讀,為你的決策系統(tǒng)提供數(shù)據(jù)依據(jù),并利用你身體中的“反饋控制系統(tǒng)”執(zhí)行你的意志,完成與現(xiàn)實世界的物理交互。
如果人類作為一個“智能行為體”依靠著“人肉傳感器”可以接收到源源不斷地外部數(shù)據(jù),從而實現(xiàn)智能決策,那么,汽車為什么不可以?
傳感器如何作用于自動駕駛?如何作用于無人駕駛這一宏圖偉愿?
我們終于進(jìn)入了正題,沒錯,我就是這樣任性的寫了這么一大段前言,沒毛病。
自動駕駛依靠傳感器去獲取車體周遭環(huán)境,每種傳感器都有各自所擅長的優(yōu)勢以及限制,需要結(jié)合各類傳感器的優(yōu)點,進(jìn)行技術(shù)互補(bǔ)來完成對于周圍環(huán)境的理解和響應(yīng)。
這些各類傳感器需要通過“傳感器融合”的技術(shù)手段,去完成數(shù)據(jù)收集后的分析處理,借助數(shù)據(jù)融合實現(xiàn)各類傳感器的在環(huán)境監(jiān)測數(shù)據(jù)方面的一致性視角的同步分析,來盡可能的為汽車提供周圍環(huán)境的準(zhǔn)確信息。
一、數(shù)碼相機(jī)(攝像頭)
數(shù)碼相機(jī)之于無人駕駛駕駛就如同眼睛之于人類——人靠眼睛捕獲外部信息,智能汽車則依靠數(shù)碼相機(jī)獲取車外環(huán)境信息。
隨著相關(guān)技術(shù)的發(fā)展,數(shù)碼相機(jī)的性能越來越高,這體現(xiàn)在:諸如拍攝速度越來越快、成像質(zhì)量越來越高等方面。
將之加之于汽車上,就如同為其配備了一雙可以觀察世界的眼睛。這為我們之前的文章中所提到的“中層控制系統(tǒng)”提供了重要的數(shù)據(jù)源,深度學(xué)習(xí)算法通過這些采集到的環(huán)境數(shù)據(jù)就可以進(jìn)行物體識別、軌跡預(yù)測等操作。
應(yīng)用于無人駕駛領(lǐng)域的專業(yè)數(shù)碼相機(jī),同樣遠(yuǎn)非簡單記錄像素值那般簡單。它可以自動分析圖片數(shù)據(jù)處理圖片所包含的“內(nèi)容”,可以自動檢測出畫面中的各種物體,并轉(zhuǎn)化成數(shù)值表格,羅列出物體信息清單,為進(jìn)一步識別和判斷提供預(yù)處理數(shù)據(jù)。
但是,不同于生物體具備的“立體視覺”,數(shù)碼相機(jī)可以把三維空間數(shù)據(jù)轉(zhuǎn)化為二維像素矩陣,卻會遺漏最關(guān)鍵的要素信息——深度數(shù)值。
生物體一般具備至少兩只及以上的眼睛,在獲取二維圖像信息的同時也會依靠深度感知能力得到深度距離信息(簡單來說:咱們不僅能在老遠(yuǎn)的地方,就能看到村頭的狗蛋,還能大概知道他距離我多遠(yuǎn)),從而形成三維“立體視覺”。
如果車與物體的距離不能被準(zhǔn)確感知,那么,關(guān)鍵性的決策信息將無法被補(bǔ)足,對于自動駕駛來說,物體深度距離的判定尤為重要。
目前的一個解決方案就是:借鑒于生物體的形態(tài)為汽車配置多臺數(shù)碼相機(jī)去捕捉統(tǒng)一視覺鏡頭,就可以通過計算機(jī)重建3D場景,對于車體的周圍環(huán)境有更為清楚的深度認(rèn)知。
這樣一來,以車體為中心,固定半徑距離內(nèi)的所有物體的橫向布局和縱向深度距離就能夠非常清楚的顯現(xiàn)出來了。
而另外一個方案就是具備投影功能的“結(jié)構(gòu)光相機(jī)”,它能夠使圖片數(shù)據(jù)附著深度信息。結(jié)構(gòu)光相機(jī)可以將光纖投射到目標(biāo)場景上并測量其失真度,通過失真度測量計算出深度數(shù)據(jù)。
但是,其弱點也相對更為突出:一是如果日光較為強(qiáng)烈相機(jī)投射出的光線就會收到影響和干擾,二是超過一定的距離(10米左右),結(jié)構(gòu)光相機(jī)的作用就會蕩然無存。
結(jié)合不宜日光強(qiáng)烈和限定距離這兩個使用場景,該方案主要用于室內(nèi)行車操作,比如:出入車庫或者停車場。
二、激光雷達(dá)
激光雷達(dá),全稱“光檢測與測距”(Lidar),它通過向周圍不斷地發(fā)射脈沖激光束,然后根據(jù)光束折返回來所用的時間去完成測距任務(wù)。
每秒數(shù)百萬次的發(fā)射頻率使得Lidar傳感器可以計算出周遭環(huán)境的三維數(shù)字模型,真正地實現(xiàn)3D世界的可視化,完成高精度3D模型的繪制。
激光雷達(dá)具備360度全方位無死角的可視能力,且具備深度信息的探測能力——實時掌控與周圍物體間的準(zhǔn)確距離。
在激光雷達(dá)誕生的半個世紀(jì)以來,它常常被用于地形測繪,甚至考古領(lǐng)域,1971年阿波羅計劃期間,宇航員用其繪制了月球表面,展現(xiàn)出了其卓越的應(yīng)用價值。直到21世紀(jì)初期,此項技術(shù)才與汽車產(chǎn)生聯(lián)系,在DARPA的數(shù)屆挑戰(zhàn)賽上激光雷達(dá)大放異彩,且在此之后逐漸流行。
激光雷達(dá)的工作原理曾有一段形象的比喻:
就好像你身處一個充滿了隱形物體的房間內(nèi),激光雷達(dá)就好像你手中的紅色涂料,你旋轉(zhuǎn)著身姿將紅色涂料向四周噴射。很快,那些隱形的物體會因為沾染了涂料而顯現(xiàn)出它的外形,展現(xiàn)在你的面前。當(dāng)涂料足夠多噴射的足夠遠(yuǎn)覆蓋的足夠全,那么整個房間內(nèi)的所有隱形物體將無所遁形的暴露出來。
激光雷達(dá)的工作原理就是如此:通過不斷的進(jìn)行光束發(fā)射,對周圍進(jìn)行掃描和測量,光束越多越密場景模型的精度就越高。
這里我們需要引入“點云”這一概念進(jìn)行說明,通過測量儀器得到的產(chǎn)品外觀表面的點數(shù)據(jù)集合也稱之為點云。
點與點之間間距越大我們稱為“稀疏點云”,反之通過三維激光掃描儀得到的點云因為因為描述物體外觀的點數(shù)較多較密的我們稱之為“密集點云”。
Lidar以特定模式向外發(fā)射激光束形成大量細(xì)密的點組成的掃描線。如果想要構(gòu)建較為完整的3D模型,那就必須讓其高速旋轉(zhuǎn),我們可以使用一組旋轉(zhuǎn)的鏡子去改變激光的方向。這樣,激光束越多就會呈現(xiàn)出以激光雷達(dá)為中心一組組不斷向外擴(kuò)展的環(huán)形掃描線,就像一顆石頭投入一片靜水中,同心圓狀的漣漪就會向四周蕩開。
這些平行且極為密集的環(huán)形掃描線碰觸到實體事物后就會顯現(xiàn)出外部形狀,一如上述所述的“噴涂”的例子一樣。
由此,當(dāng)汽車裝載了激光雷達(dá),那么汽車也就能實現(xiàn)對于陌生世界的“噴涂”從而“看到”現(xiàn)實的周圍環(huán)境。
激光雷達(dá)傳感器為中層控制系統(tǒng)中的算法提供了詳盡的環(huán)境數(shù)據(jù)流,深度算法據(jù)此可以對數(shù)據(jù)進(jìn)行解析,識別出:這些已經(jīng)顯現(xiàn)的具備某種外部形狀的物體可能會是什么?從而達(dá)到對于行車環(huán)境的實時監(jiān)控和準(zhǔn)確識別,為決策系統(tǒng)進(jìn)行端起的軌跡預(yù)測和路徑規(guī)劃提供依據(jù)。
三、雷達(dá)
雷達(dá),又稱“無線電檢測與測距”,由發(fā)射器和接收器組成,發(fā)射器負(fù)責(zé)向外發(fā)射電磁波,接收器負(fù)責(zé)接收反射回波。
其工作原理就是:按照一定的頻率向目標(biāo)區(qū)域去發(fā)射電磁波,電磁波以等同于光速的傳播速度呈環(huán)裝極速向外擴(kuò)張,利用電磁波在碰觸障礙物的時候反射形成的回波來檢測周圍的現(xiàn)實環(huán)境和物體布局。
由于折返的回波能量在傳播的過程中會逐漸衰減,所以接收器一般都會采用電波放大技術(shù)以便于捕獲盡可能多的回聲,獲取更多的環(huán)境信息。
舉個栗子:
想象一下,你正閉著眼站在一個未知的空間內(nèi),你的手里捧著一堆彈力球,你轉(zhuǎn)動一下身子就向一個方向拋擲彈力球。如果那個方向的彈力球,沒有折回打到你的身上,那么至少你就會知道這個方向多半是一條通途。
相反,彈回并打在你身上的那個彈力球,拋擲方向多半是有一個龐大的障礙物在等著你。這樣,你在無法用眼睛去觀察環(huán)境的情況下,就可以借助彈力球去了解:周圍是否存在障礙物等環(huán)境信息。
在這個例子中,拋擲彈力球的手就像雷達(dá)的發(fā)射器一樣,彈力球就像發(fā)射出的電磁波,而是否被回彈的彈力球所擊中的身體就是接收器。
你通過拋擲彈力球并根據(jù)身體是否被其回彈擊中就能完成判斷。
言歸正傳,不同的雷達(dá)傳感器擁有不同的波長,波長越長傳輸?shù)镁嚯x越遠(yuǎn)。但長波往往會繞過微小的物體,對于環(huán)境監(jiān)測的半徑相對較長,但監(jiān)測結(jié)果也更為粗略,對應(yīng)的微波在細(xì)小物品的監(jiān)測上展示出來的結(jié)果則是令人滿意的。
另外,雷達(dá)傳感器根據(jù)多普勒效應(yīng)可以監(jiān)測物體的移動速度。通過監(jiān)測記錄電磁波向目標(biāo)物體發(fā)射和反射回波的頻率變化,去判斷移動中的物體是在靠近還是遠(yuǎn)離,更進(jìn)一步算出其移動速度。
對于自動駕駛汽車來說,雷達(dá)傳感器的應(yīng)用,可以實時監(jiān)測車體的周邊環(huán)境,識別大型障礙物體,可以應(yīng)對大雨、濃霧等異常天氣,不受路面揚(yáng)塵等影響,精準(zhǔn)檢測物體距離車體的位置,以及各個物體的行進(jìn)方向和速度。
四、超聲波傳感器
超聲波傳感器,又稱“聲吶”。
與雷達(dá)相似,超聲波傳感器也是通過發(fā)射某種波形信號并通過檢測回波頻率去監(jiān)測環(huán)境信息。不同于雷達(dá)的電磁波,超聲波傳感器就如同它的命名一樣發(fā)射的是超聲波。
超聲波傳感器也分為兩個部分:發(fā)送器和傳感器。
發(fā)送器產(chǎn)生高于人類所能收聽范圍的機(jī)器波,接收器感受到聲波的回聲根據(jù)物體反射回來的時間、頻率和聲波形狀來監(jiān)測物體的位置和速度。同樣,它也具備穿透濃霧、揚(yáng)塵天氣環(huán)境的能力,能在刺眼的陽關(guān)下觀測物體。
相較于雷達(dá)的電磁波,聲波的傳播速度相對較慢,這就意味著:它能以高分辨率來看清微小物體,但是在風(fēng)和距離的影響下衰減較快——也就是說其監(jiān)測范圍相對較小,日常應(yīng)用中經(jīng)常與雷達(dá)傳感器互為補(bǔ)充。
五、毫米波雷達(dá)傳感器
毫米波雷達(dá),簡而言之就是工作在毫米波頻段的雷達(dá),而毫米波其實質(zhì)上就是電磁波的一個頻段。
毫米波是指:波長處于1mm~10mm之間的電磁波,位于微波與遠(yuǎn)紅外波相交疊的波長范圍,對應(yīng)的頻率范圍為10~200GHz,其頻率高于無線電且低于可見光和紅外線。
根據(jù)波的傳播理論,頻率越高,波長越短,分辨率越高,穿透能力越強(qiáng),但在傳播過程的損耗也越大,傳輸距離越短;相對地,頻率越低,波長越長,繞射能力越強(qiáng),傳輸距離越遠(yuǎn)。
所以,毫米波天然地具備分辨率高、指向性強(qiáng)、抗干擾能力佳等優(yōu)點,隨之在一定的距離范圍內(nèi)可以保證較好的環(huán)境探測能力。其探測距離處于150m-250m之間,高性能的毫米波探測雷達(dá)甚至可以達(dá)到300m的廣域,極大地滿足自動駕駛汽車在高速運(yùn)動時所需要的探測范圍。
其工作原理是通過比較電磁波傳播遇到介質(zhì)之后的回波,與發(fā)出波形的頻率差和時間差去計算障礙物與本體的距離。障礙物距離本體現(xiàn)實距離越遠(yuǎn),回波時間就越長,那么與發(fā)出波形的頻率差值就越大。再將發(fā)出波形的頻率與回波的頻率進(jìn)行減法運(yùn)算即可得出頻率差,據(jù)此判斷出障礙物體的距離值。
通過以上我們看到毫米波雷達(dá)的巨大優(yōu)勢和應(yīng)用價值,與極易受天氣等自然環(huán)境影響的攝像頭,或是超聲波傳感器相比毫米波雷達(dá)傳感器憑借其不受塵霧、雨雪等惡劣天氣影響的絕對優(yōu)勢榮膺“全天候全天時”的桂冠,成為眾多汽車輔助駕駛系統(tǒng)的不二選擇。
并且,憑借多普勒效應(yīng)原理毫米波雷達(dá)具備出色的測距測速能力,毫米波雷達(dá)被廣泛地應(yīng)用在自適應(yīng)巡航控制(ACC)、前向防撞報警(FCW)、盲點檢測(BSD)、輔助停車(PA)、輔助變道(LCA)等汽車ADAS中。
最后
各種類型的傳感器因為各自的技術(shù)原理,都有其擅長的應(yīng)用場景,發(fā)揮著其他類型的傳感器天生不具備的優(yōu)勢。
就像人的眼睛能“看”卻不具備“聽”的功能,耳朵能“聽”卻不能“看”,但如果將眼睛所見,和耳朵所聽結(jié)合起來,我們就能非常全面的了解我們所在的場景環(huán)境。
同樣,我們只有將各類傳感器所具備的優(yōu)勢進(jìn)行整合,才能極大化地獲取盡可能完整的環(huán)境信息,幫助汽車掌握盡可能多的環(huán)境數(shù)據(jù),為更高層級的控制系統(tǒng)提供可靠的決策依據(jù)。
所以,多傳感器的融合將是未來的趨勢,也是自動駕駛系統(tǒng)必要的技術(shù)儲備。
對于自動駕駛汽車來說,傳感器源源不斷地提供環(huán)境數(shù)據(jù)流是一切的根本。
再精巧的機(jī)械系統(tǒng),再智能的算法,如果沒有了環(huán)境數(shù)據(jù),它就無法進(jìn)行反饋控制。沒有任何的決策依據(jù),更談不上“自動駕駛”這一根本訴求。就像人一樣,看不到影像,聽不到聲音,感受不到任何地外界變化,再聰明地大腦也只能束手無策。
從根本上講,這個世界任何一種生物都是自然環(huán)境的組成部分。作為生態(tài)鏈條的每一環(huán),彼此之間都在進(jìn)行著各種層面地接觸和交互,正是由于這種本質(zhì)關(guān)系地存在,對于環(huán)境的了解和觀察,以及隨之產(chǎn)生的反饋行為才是各種生物生存的根本。
本文由 @江天一隅 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
能不能再講講現(xiàn)在的無人駕駛的落地應(yīng)用,以及當(dāng)前應(yīng)用時遇到的局限? 比如為什么需要設(shè)置上下車點,什么樣的路線適合什么級別的自動駕駛技術(shù)去落地等等?
期待 ??