資源描述:
《自動駕駛陷入泥潭_Uber如何走出困境.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、自動駕駛陷入泥潭_Uber如何走出困境 首先需要強調(diào),我并不清楚造成此次事故的具體原因,也不會將其認定為無法避免的狀況。此外,我也不打算在本文當(dāng)中對任何人加以指責(zé),或者對任何肇事原因作出證明。換言之,我只是在單純討論為什么這個問題對于人工智能類系統(tǒng)而言,要比常規(guī)駕駛情況下更難以解決?! ≡趲缀跛行滦蛙囕v上,我們都能找到常規(guī)的碰撞回避(“collisionavoidance”,簡稱CA)系統(tǒng)。這套系統(tǒng)的作用非常單一,或者說只有一項目標——在車輛即將發(fā)生碰撞時剎車。這種“確定性”意味著其會在檢測到某種特定信號時,采取與之對應(yīng)的動作(即制動)。對
2、于同一種信號,其總是會產(chǎn)生同樣的反應(yīng)。此外,還有一些碰撞回避系統(tǒng)會根據(jù)環(huán)境采取一些基于概率的判斷,但總體來講,碰撞回避系統(tǒng)通常非常簡單:當(dāng)車輛以不合理的速度接近某個位置時,其會觸發(fā)剎車。您可以在程序代碼當(dāng)中使用簡單的IF語句來實現(xiàn)這項功能?! ∧敲?,為什么人工智能型系統(tǒng)就做不到這一點?人工智能是系統(tǒng)展示其認知技能的一種能力,例如學(xué)習(xí)以及解決問題。換言之,人工智能并非依靠預(yù)編程方式來監(jiān)測來自傳感器的已知輸入信號,從而采取預(yù)定義的行動。這意味著,不同于以往對已知情況進行預(yù)定義的處理方式,如今我們需要為算法提供大量數(shù)據(jù)以實現(xiàn)人工智能訓(xùn)練,并借此引導(dǎo)其
3、學(xué)會如何操作——這就是機器學(xué)習(xí)的基本原理。如果我們利用機器學(xué)習(xí)技術(shù)建立一套碰撞回避系統(tǒng),其完全能夠達到近乎完美的效果——但這也意味著其仍然屬于單一目的系統(tǒng)。它可以剎車,但卻學(xué)不會導(dǎo)航?! ?dǎo)航功能由感知并解釋環(huán)境、作出決策并采取行動這幾個部分組成。環(huán)境感知則包括路徑規(guī)劃(駛向何處)、障礙物檢測以及軌跡估算(探測到的物體如何移動)。除此之外還有很多。現(xiàn)在可以看到,避免碰撞只是其需要完成的眾多任務(wù)當(dāng)中的一項。系統(tǒng)同時面對著很多問題:我要去哪里在、我看到了什么、如何解釋這些景象、是否有物體在移動、其移動速度有多快、我的軌跡是否會與他人的路線發(fā)生交叉等
4、等?! ∵@種自主導(dǎo)航問題太過復(fù)雜,無法簡單在程序代碼中使用IF-ELSE語句(IF-ELSEstatements)并配合傳感器信號讀取加以解決。為什么?因為要獲取完成這項任務(wù)所需要的一切數(shù)據(jù),車輛當(dāng)中必須包含數(shù)十個不同的傳感器。其目標,在于建立一套全面的視野,同時彌補單一傳感器所存在的不足。如果我們現(xiàn)在對這些傳感器所能產(chǎn)生的測量值組合數(shù)字進行估算,就會發(fā)現(xiàn)這套自動駕駛系統(tǒng)有多么復(fù)雜。很明顯,模擬其中每一種可能的輸入組合已經(jīng)遠遠超過人類大腦的處理能力?! 〈送猓@種自我學(xué)習(xí)系統(tǒng)很可能以概率作為指導(dǎo)基礎(chǔ)。如果其在路上注意到某些事物,其會考慮所有的潛
5、在選項并為其附加對應(yīng)概率。舉例來說,物體為狗的概率為5%,物體為卡車的概率為95.7%,那么其會將對方判斷為卡車。但是,如果傳感器給出的輸入內(nèi)容存在矛盾,又該怎么辦? 這種情況其實相當(dāng)常見。舉例來說,普通的攝像機能夠清晰拍攝到近距離物體,但只能以二維方式呈現(xiàn)。激光雷達屬于一種激光發(fā)射器,其能夠在三維空間中看到同一個物體,但觀察結(jié)果卻缺乏細節(jié)——特別是色彩信息(詳見下圖)。因此,我們可以利用多臺攝像機從多個角度拍攝以重建三維場景,并將其與雷達“圖像”進行比較。如此得出的綜合結(jié)果顯然更為可靠。然而,攝像機對光照條件非常敏感——即使是少量陰影也可能
6、干擾場景中的某些部分并導(dǎo)致輸出質(zhì)量低下。作為一套出色的識別系統(tǒng),其應(yīng)該能夠在這種情況下更多依賴于雷達系統(tǒng)的輸入。而在其它情況下,則更多依賴于攝像機系統(tǒng)。而兩類傳感器得出共識性結(jié)論的部分,則屬于可信度最高的判斷?! D:我坐在辦公室的椅子上(位于圖像中心位置)揮舞著VelodyneVLP-16雷達。自動駕駛汽車所使用的激光雷達擁有更高的分辨率,但仍然無法與攝像機相媲美。請注意,此圖像來自單一雷達掃描,我們可以進行多次雷達掃描以進一步提升圖像分辨率?! ∧敲矗绻麛z像機將目標識別為一輛卡車,但雷達認為這是一只狗,且兩種結(jié)論的可信度對等,結(jié)果又將
7、如何?這實際上是一種最為困難,且可能無法解決的狀況?,F(xiàn)代碰撞回避系統(tǒng)會使用記憶機制,其中包含車輛曾經(jīng)看到過的地圖與寄存內(nèi)容。其會追蹤圖像之間的記錄信息。如果兩秒鐘之間兩套傳感器(更準確地說,兩種解釋傳感器計數(shù)的算法)皆認為目標為卡車,而稍后其中一套認為其是狗,那么目標仍會被視為卡車——直到出現(xiàn)更強有力的證據(jù)。請記住這個例子,我們將在稍后探討優(yōu)步事件時再次提到?! ∵@里咱們回顧一下。之前我們已經(jīng)講述了人工智能必須處理來自眾多不同傳感器的輸入內(nèi)容,評估傳感器輸入內(nèi)容的質(zhì)量并構(gòu)建場景認知結(jié)論。有時不同傳感器會給出不同的預(yù)測結(jié)果,而且并非所有傳感器在任
8、意時間段內(nèi)皆可提供信息。因此,該系統(tǒng)會建立一套影響判斷過程的記憶機制,這一點與人類一樣。此后,其需要將這些信息加以融合,從而對當(dāng)前狀況作出一致的判斷進