雙目ORB-SLAM2代碼個人總結（一）

為了好好把ORB-SLAM2的代碼搞懂，特別寫文章作為總結。其代碼本身就有許多的注釋，我在學習以及總結時也參考了很多，特此說明。代碼見：

raulmur/ORB_SLAM2?

github.com

注意：目前我只關心雙目的SLAM，因此只總結了雙目的部分。總結時我也不會寫很瑣碎的東西，比如記錄每一次處理時間這種比較無關緊要的；另外，不是最關鍵的函數我也不會分析（比如系統關閉類似的），我希望這個總結盡量高效。不過由於我才開始學，編程也不好，所以還是會寫一些顯而易見的東西，希望能對想我一樣的初學者有所幫助。另外，本人由於水平所限也不可能全部理解或者理解的都正確，還請多多包涵。

此系列文章僅發於我的知乎專欄，轉載請註明出處附上本文連接，不得用於商業用途，侵權必究。

首先說一下代碼在命名變數時的規則：「p」表示指針數據類型， "n"表示int類型，「b」表示bool類型 "s"表示set類型，「v」表示vector數據類型，「I」表示list數據類型，「m」表示類的成員變數，「t」表示線程。

其中m、p、v、b我覺得是最常見，知道命名規則的話對代碼理解會有一定幫助。

1. http://stereo_kitti.cc

我是在KITTI數據跑的ORB-SLAM2，因此我以Example中的http://stereo_kitti.cc為入口學習代碼。

1）讀取圖片的路徑+名稱、時間戳

這部分很簡單，通過LoadImages函數完成，該函數把左右圖片的路徑+名稱（string）、時間戳信息（double）分別讀入三個vector容器：vstrImageLeft、vstrImageRight、vTimestamps。

2）創建SLAM系統

使用ORB_SLAM2::System類的構造函數創建SLAM系統，具體的在看System的代碼時再說。這一步初始化了系統的各個線程，準備好處理輸入的幀。

3）主循環：處理每一幀（左右圖）輸入

第一步把要處理的圖像的路徑+名稱、時間戳都讀到vector中，這一步僅需讀取使用它們（圖片使用cv::imread讀取）。這一步中最關鍵的一步就是：

SLAM.TrackStereo(imLeft,imRight,tframe);

使用了ORB_SLAM2::System中的TrackStereo函數，輸入就是：左圖(cv::Mat)、右圖(cv::Mat)、對應時間戳(double)。

如果處理一幀所用時間小於兩幀之間實際拍攝所間隔時間，則用usleep函數停頓相應時間再進行下一輪循環。

4）主循環結束後系統關閉

使用System類中的Shutdown函數停止所有線程。最後計算了平均每幀的處理時間，並且保存相機軌跡到CameraTrajectory.txt文件。

2. http://System.cc

前面用到了System類中的函數，這裡進行學習http://System.cc代碼。

1）ORB_SLAM2::System的構造函數

System::System(const string &strVocFile, const string &strSettingsFile, const eSensor sensor, const bool bUseViewer): mSensor(sensor), mpViewer(static_cast<Viewer*>(NULL)), mbReset(false),mbActivateLocalizationMode(false), mbDeactivateLocalizationMode(false)

ORB-SLAM2基於詞袋方法實現閉環檢測，同時利用詞袋中的樹結構加速了關鍵點之間的匹配。構造函數的輸入「strVocFile」是系統使用的視覺詞典文件的名稱，如：Vocabulary/ORBvoc.txt。System構造函數中使用DBoW2::TemplatedVocabulary（來自第三方庫DBoW2的模板類）構造的ORBVocabulary類來初始化系統使用的視覺單詞的詞典，這個詞典是System類的一個屬性，名為"mpVocabulary"。mpVocabulary的初始化使用DBoW2::TemplatedVocabulary類的方法「loadFromTextFile」完成。

System構造函數的輸入「strSettingsFile」是系統的配置文件，如：Examples/Stereo/KITTI00-02.yaml（該文件是用ORB-SLAM2跑KITTI的00-02序列所用的配置文件）。System的構造函數通過使用cv::FileStorage類的構造函數試圖讀配置文件來檢查該文件是否有問題（構造函數並沒有真正讀取配置文件中的內容）。

System構造函數的輸入「sensor」對應著枚舉類型「eSensor」，這裡雙目應該是STEREO（=1）。

System構造函數最後一個輸入「bUseViewer」表示是否使用Viewer線程，我們跑ORB-SLAM2時需要查看直觀上的運行效果，因此這裡構造System類對象時默認輸入true。

根據最開始提到的命名規則，mpViewer是System的一個成員並且是一個指針，它指向系統的Viewer線程，在http://Viewer.cc中定義，初始為NULL。

mbReset是一個布爾型的成員變數，系統重置的標誌；mbActivateLocalizationMode是一個布爾型的成員變數，激活定位模式（應該是不建圖只跟蹤定位）的標誌；mbDeactivateLocalizationMode則是關閉定位模式的標誌。這三個系統的標誌成員變數初始都為false。

由於ORB-SLAM2系統是「基於關鍵幀優化」的SLAM系統，因此System需要在構造函數中初始化一個關鍵的成員變數「mpKeyFrameDatabase」，它就是指向「關鍵幀資料庫」的指針（類型為KeyFrameDatabase*）。這個資料庫主要用於重定位和閉環檢測，其實就是在「需要進行感測器所處位置的再次識別」時，系統會在這個關鍵幀資料庫里搜索過去可能對應同一位置的關鍵幀。該資料庫類的初始化通過KeyFrameDatabase（關鍵幀資料庫的類）的構造函數完成（http://KeyFrameDatabase.cc中），僅需輸入系統的詞典（*mpVocabulary）。這一步代碼如下：

mpKeyFrameDatabase = new KeyFrameDatabase(*mpVocabulary);

系統初始化了地圖類（Map），同樣是用一個成員指針指「mpMap」向它。Map的具體定義在http://Map.cc中。該類將保存所有關鍵幀和地圖點的指針。

系統還初始化了分別指向FrameDrawer和MapDrawer兩個類的成員指針mpFrameDrawer、mpMapDrawer。這兩個類分別定義在http://FrameDrawer.cc和http://MapDrawer.cc中，是系統運行效果可視化的關鍵。

然後最關鍵的，System分別利用對應類的構造函數初始化了指向Tracking類(http://Tracking.cc)、LocalMapping類(http://LocalMapping.cc)、LoopClosing類(http://LoopClosing.cc)的成員指針mpTracker(Tracking*)、mpLocalMapper(LocalMapping*)、mpLoopCloser(LoopClosing*)。說這三者是最關鍵的，原因在於這三者分別對應著ORB-SLAM2系統最基本的三個線程（可以參考一下ORB-SLAM2系統的結構圖）。其中，System專門初始化了mptLocalMapping(std::thread*)、mptLoopClosing(std::thread*)兩個變數來啟動局部建圖與閉環線程。為什麼沒有通過線程指針變數啟動Tacking類對應的線程呢？因為還有一個主線程，Tacking類就是在主線程中被調用運行的。

Tracker（跟蹤線程）：接受輸入幀後計算對應的相機位姿（旋轉與平移）。它還要以較為寬鬆的條件決定創建一些新地圖點、選出一些關鍵幀送到局部建圖線程。另外，如果跟蹤失敗了就要進行重定位。

LocalMapper（局部建圖線程）：管理著局部地圖，還要進行局部集束優化。另外，它也會創建新地圖點，還會對地圖點、關鍵幀進行較為嚴格的篩選剔除。

LoopCloser（閉環線程）：對每一個局部建圖線程送過來的關鍵幀都利用詞袋的方法在關鍵幀資料庫里搜索有沒有對應的閉環關鍵幀（搜索到了跟當前關鍵幀長得很像的之前出現的關鍵幀，則說明感測器運動軌跡出現了閉環）。如果檢測到了閉環，它就會進行一個圖優化步驟，並且啟動其後的「全局集束優化線程」。當然，檢測到閉環後還要進行閉環融合（處理重疊的軌跡與重複的地圖點）。

雙目ORB-SLAM2代碼個人總結（一）

1. http://stereo_kitti.cc

2. http://System.cc

3. http://Tracking.cc

热门新闻

周热门

雙目ORB-SLAM2代碼個人總結（一）

1. http://stereo_kitti.cc

2. http://System.cc

3. http://Tracking.cc

初始化 | SVO 論文與代碼分析分講

重定位 | VINS-Mono 論文公式推導與代碼解析分講

小覓智能 | SVO 學習筆記（持續更新中）

SLAM、定位、建圖求職分享

[分享]激光場景導航-SLAM

PCL之軌跡繪製（二）

視覺SLAM的建圖課件3

表面法向量surface normal(源碼)

通俗地解釋粒子濾波器

解放雙手|教你進行相機與IMU外參的在線標定

ORB-SLAM源碼分析一:在Qt上調試

位姿估計 | SVO 論文與代碼分析分講

深度學習SLAM——DeepVO2016——總結

公開課視頻回放 | 基於RGBD和IMU的實時室內SLAM及三維重建

(10,11)SLAM根據兩幀圖像對應的匹配點計算基礎矩陣並繪製極線

热门新闻

周热门