無人車駕駛的問題則可以理解為一個s和a都是連續的問題。例如我們將感測器捕捉到的當前路況設為s,它顯然是連續的;而我們將操作方向盤、踩油門、剎車等等設為a。由於方向盤轉動的角度是連續的,加速減速也是連續的,故而a也顯然是一個連續的變數。
在工程式控制制、工業機器人等等領域,有大量問題都可以轉化為s連續、a離散或者是s連續a離散的MDP問題。這些與我們的生活是息息相關的。與之相比,s和a都離散的情況則出現得比較少,出現在規則簡單的遊戲(例如棋牌類)或者簡單的控制系統(例如電梯)之中。還有一種情況——s離散而a連續的情況則相對而言又更少了。