圖1.系統概述。給定一個輸入圖像,Lane Net輸出一個車道實例地圖,車道ID標記每個車道像素。接下來,使用H-Net輸出的變換矩陣變換車道像素,H-Net學習以輸入圖像為條件的透視變換。對於每一條車道,都用三階多項式擬合,並且車道被重投影到圖像上。
通過訓練神經網路進行端到端的車道檢測,將車道檢測作為實例分割問題來實現,解決了上述車道切換以及車道數的限制的問題。我們將稱之為LaneNet(參見圖2)的網路,將二進位車道分割與單鏡頭實例分割的聚類損失函數相結合。在LaneNet的輸出中,每個車道像素被分配它們對應車道的ID。因為LaneNET輸出每個車道的像素集合,我們必須通過這些像素來獲得車道參數化的曲線。
通常情況下,車道像素被投影成「鳥瞰圖」表示,使用一個固定的轉換矩陣。然而,由於變換參數對所有圖像都是固定的,所以當遇到非地面時,例如在斜坡上,這會引起一些問題。為了緩解這個問題,我們訓練一個網路,稱為H-Network,它可以估算輸入圖像上的「理想」透視變換的參數。