本文作者:Ljubo Vlacic

導讀

2018年第五期(總第二十九期)「錢學森國際傑出科學家系列講座」於9月5日在中科院自動化研究所舉辦。本期講座邀請到澳大利亞格里菲斯大學Ljubo Vlacic教授做題為「Inventing the Future: Supremacy of Control & Decision Making Systems」的報告。報告將著眼於展示在創造社會所需工具時的反饋力量和其基礎理論,它強調了控制系統理論的優點,而這種優點不僅會改變未來,更會創造未來。Ljubo Vlacic教授將反思控制系統和人工智慧之間的協同作用,並將它們視為幾乎每個智能系統和支撐工程式控制制論的兩個基本和互補的組成部分。

報告主題

Inventing the Future: Supremacy of Control & Decision Making Systems

報告內容

主持人:非常榮幸邀請到來自澳大利亞格里菲斯大學的Ljubo Vlacic教授進行題為「Inventing the Future: Supremacy of Control & Decision Making Systems」的報告,首先請允許我對Ljubo Vlacic教授進行介紹。

Ljubo Vlacic是格里菲斯大學綜合與智能系統研究所的教授。他是一位控制系統科學家和實踐者,以對無人駕駛車輛和智能控制系統研究與開發的貢獻而聞名。他的研究成果經常登上新聞頭條,並在全球媒體傳播。他在工業界和學術界擔任多個領導者的職務。為表彰他的成就,他獲得了IEEE成就獎(全球),Lionel Hooke爵士獎,昆士蘭年度專業工程師獎和黃金海岸商業活動大使獎等19個獎項。他主持過10次國家和國際科學會議。目前,Ljubo Vlacic擔任:(i)IEEE智能交通系統雜誌總編輯;(ii)澳洲工程師學院董事會主席;(iii)昆士蘭IET網路主席;(iv)2019 IEEE智能交通系統會議ITSC2019總主席。並且他還畢業於音樂學院(小提琴),並與專業的樂團和交響樂團合作演奏過。讓我們掌聲歡迎Ljubo Vlacic教授。

主講嘉賓:感謝精彩的介紹。首先,很榮幸今天能夠進行本次講座,我十分仰慕和尊敬錢學森教授及其為國家所做出的貢獻,因此非常感謝王飛躍教授誠摯的邀請。

本次講座內容主要圍繞「控制與決策系統的奇妙世界(Amazing World of Control & Decision-Making Systems)」這一主題,旨在闡述論證反饋的作用及其用於研發社會所需機器人的理論基礎,突出強調能夠以構建和開創未來的方式展望前景的控制系統理論本質。

錢學森國際傑出科學家系列講座是思考控制系統與人工智慧協同作用的一個良好契機。這兩者可被看作智能系統和基礎工程式控制制論的兩種基本且互補的組成部分。

反饋控制(Feedback Control)可由在反饋中結合的物理實際或人工設計對象(Object)表示。其作用是應對系統所受未知外部影響而導致的被控對象未知動態變化,目標是利用反饋以保持系統整體動態穩定。

負反饋原則(Principle of negative feedback)是反饋控制系統運行的實質。其中,誤差信號作為衡量系統實際與期望運行狀態(Desired regime)偏差的指標,用以獲知實際運行狀態。從而使得在已知期望運行狀態和由反饋信號表示的實際運行狀態的情況下,能夠依據兩者的偏差思考並嘗試採取相應的調整措施。

偏差(Deviation)通常由被控對象運行性能的未知變化或其所受未知擾動(Disturbances)導致,抑或可能同時受兩者影響。控制器(Controller)的作用是儘可能預測這些變化,保護被控對象使其免受變化的影響,以及即使處於外部擾動的持續作用下,也能消除偏差並使被控對象重新回到穩定狀態。

控制系統(Control Systems)控制與維持未知對象在未知環境條件下工作運行的能力源於自身的學習和適應(Learning and Adaption)能力。

閉環控制系統的關鍵原理可簡要概述為:「為瞭解決實時控制問題,需要確定對象的基本特性。控制器在執行控制操作的同時也對其與對象的關係及影響關係變化的因素進行自學習。在此過程中,控制器將會尋找以最佳方式調控因素的規律,甚至預測其進一步發展變化。」

目前,控制系統已在醫學、機器人學和機電一體化、通信、水資源以及工業製造等行業領域得到廣泛應用。一般來說,其隱含在硬/軟體系統中實時執行特定應用,並在許多先進技術解決方案中發揮重要作用。

由於反饋控制理念的應用,僅在醫療健康產業領域就已取得相當多令人振奮的創新性解決方法成果。舉例來說,其中包括呼吸系統(The respiratory system)、肝臟和胰腺(The liver and pancreas)、動脈血壓調節(Regulation of arterial pressure)、胰島素分泌控制(Control of insulin secretion)、心臟起搏器(Pacemaker)、人工心臟(Artificial heart)等方面的應用。

那麼,為什麼反饋控制理念具有如此強大的作用並能夠應用於眾多領域?

以圖中似乎正在排放大氣污染物的工業廠房為例,當工廠的運行系統發生故障時,管理人員通過查閱書籍的方法學習相關計算控制的內容以判斷系統運行狀況。這可能使得情況很快就變得相當複雜,在用一整張紙都寫不下的方程公式中幾乎找不到可行解答。而且這些方程公式的作用有限,甚至從某種程度上來看是錯誤的,因而使計算控制變得更加困難。

當這種情況發生時,工程學方法就成為解決問題的另一種選擇。確定並測試相應的設置、收集大量數據進行理論驗證或構建查找表,嘗試以更加簡單直觀的形式替換複雜的方程公式對系統狀態進行描述表達。事實上,工程師明確地知道每一個模型僅在某些方面是切實有效的,無論是複雜還是簡單的方法。因此,模型的適用性是有限的。但即便知道模型可能不需要包含所有的影響因素,細節過程的不足也可能會使得模型的構建受到質疑,因為甚至最簡單的模型也能夠破壞模型的易變性以及物理系統本身。這就是控制理論能夠發揮作用並提供幫助之處。

控制領域的科學家和工程師對想法和方法的描述表達,不僅利用數學方程公式,而且還通過嚴謹的實驗論證。控制律(Control Law)表現為具有普適性且能夠縮小現實世界與理想世界的差距。實際上,H. S. Tsien(錢學森)曾在其工程式控制制論領域的重大研究成果中談到,「任何學科的數學性難題通常都是人為的。幾乎不需要進一步解釋,這個問題通常可以歸結為研究工程師的水平」。這就是Yakov. Z. Tsypkin(齊普金)和H. S. Tsien(錢學森)的看法所帶來的幫助和啟示。

因此例如對於上述工廠來說,為解決控制問題需要確定對象的基本特性。同時應用控制器,其能夠在執行控制操作的同時對其與對象的關係及影響關係變化的因素進行自學習,並將會尋找以最佳方式調控因素的規律,甚至預測其進一步發展變化。

那麼反饋的作用能力體現在哪裡?查閱文獻可以發現一系列相關應用,其中一些甚至與工程研究領域完全無關,例如經濟學(Economics)、生理現象(Physiological Phenomena)、生命系統(Living Systems)、量子力學(Quantum Physics)和社會科學(Social Science)等。

控制系統的成功應用案例之一與高等教育(Higher Education)相關。在西方國家,高等院校入學申請體系因自身的高投資回報率而成為一個非常重要的產業領域。且眾所周知,其所面臨的控制管理壓力隨著所接受國際學生申請數量的增多而加大。接下來的示例闡述將展示反饋控制在某些情況下的重要性。

假設存在一個大學招生流程,用於建立如上圖所示相應的控制系統。其中,輸入和輸出分別為期望學生數量和實際學生數量。該系統在一般控制系統結構的基礎上增加了反饋信號,用於在比較當前與期望學生數量的差值後反饋所得招生比例。招生部門將使用該系統確定招收學生數量並審批學生申請,輸出的實際學生數量同時受退學率(drop out rate)、市場和其他策略(marketing & other strategies)以及政府政策(government policy)變化的影響。

這是一個多變數控制系統的示例,其各輸入之間會進行相互補充協調。根據多變數控制系統理論,這類系統無法獲得最優結果,即達到整體絕對最優狀態,但通常可通過控制使其達到局部最優狀態。此外,若其中存在一個具有相對主導作用的輸入,那麼系統可能會逐步達到一個穩定狀態,除非其由自身控制則無法對其加以引導。就控制系統理論來說,若未引入反饋控制環節且同時考慮各方面因素的影響,盲目增加國際學生數量會使得系統偏離穩定狀態。上述案例充分反映並解釋了反饋控制理論影響西方國家重要行業領域的方式途徑。

與人工工程系統相似,機器人(Artificial Beings)的大量產生由人類(Human Beings)對豐富物質資源和提高生活質量的願望所驅動。人們對機器人的固有印象為:機器人是能夠執行一系列預編程任務的設備。通常來說,人們試圖對自身進行調整以適應機器人及其大量控制操作,但如果將這種使用方式持續下去,未來人類將不得不一直為機器人及其操作運行提供服務。這將造成一種矛盾衝突的狀況,即人類為機器人服務而非其為人類服務。然而實際上這正是人類目前所處的狀況,嚴重受制於電腦和個人設備的看管和使用。新興技術在當今社會的廣泛使用未能給予人類更多時間以享受活動本身的樂趣。

幸而,機器人目前已不再僅被看作能夠實施重複操作的自動設備。這類簡單的重複工作現在主要由機械手臂或機械操作器負責承擔,而智能機器人則有望成為人類在工作和生活中的協助者以進一步滿足使用需要,其將不僅能夠識別和理解人類的日常活動,還可以根據人類的特定需求對自身動作進行調整。

機械操作器(Robot Manipulators)與智能設備或機器人(Intelligent Robots - Artificial Beings)兩者之間存在很大差異。就機械操作器來說,其能夠檢測與感知周圍環境瞬間或突然的變化並執行操作動作。毫無疑問,智能機器人也能夠檢測和感知信號並實施操作行為,但兩者的區別在於:智能機器人能夠在此基礎上處理外部信號、觀察和判定環境狀況、學習已有經驗結果並據此決定後續操作行為。因此,對於特定操作功能的實現來說,機器人的研究與製造十分重要。且由此可見,人類所創造的現代機器人能夠作為人類的夥伴或助手提供陪伴和幫助服務,並按人類意願實施操作動作。

在日常生活中可以找到大量相關應用實例。

在我看來,未來的發展趨勢將是能夠適應人類的機器人(Human Adaptive Robotics)。其不是僅侷限於能夠實施動作和執行輔助操作的機械操作器,而是能夠處理信息、學習經驗以及決定和實施最優操作的智能設備。

不僅是單一的機器人或人類之間的相互作用(interactions),研究還應針對人類與機器人的交互關係展開。目前,對於圖中下方箭頭所代表的機器人之間交互關係的研究已經相當成熟,而圖中上方箭頭所代表的人類之間的交互關係屬於社交關係的一部分與科技領域研究無關,所以接下來將要討論的是上圖中間箭頭所代表的人類與機器人之間的雙向交互關係。

人類使用語言、表情和動作等方式對自身的觀點、意願和情感進行表達。這時,若想建立人類與機器人之間的交互關係,需要後者能夠在識別和理解人類所表達內容的基礎上對自身進行表達,即在識別、處理和理解信息後向人類進行反饋。這就是人類和機器人之間的溝通與交互方式。而對兩者交互關係研究的目的是促進人類與機器人或智能設備之間的協作關係。

協同系統(Co-operative Systems)主要用於研究人類與機器人之間的雙向相互作用,致力於建立和實現兩者間的認知交互。

雖然協同控制與決策系統(Cooperative Control & Decision Making Systems)的定義十分簡單易懂,但實際上其模擬、分析和構建卻難以實現。這類系統有助於促進跨學科和多學科的研究,推動解決協同系統問題技術的發展,已逐漸成為各類應用的重要解決方法。

日常生活中存在著各種各樣的協同系統,例如課堂中的學生和老師、工作中的職員、交通出行中的駕駛員和行人、聚會中的參加者、空中的飛機以及搜救作業中的機器人。此外,軍事偵察和攻擊任務中的無人機或戰場上的機器人也可構成協作系統。

然而,這其中有一些協同系統並不總能順利進行良好的協作,例如上圖所描繪的情況。協同系統能夠影響人類與機器人之間的協作關係,但卻無法協調人類之間的社交關係。

協同系統的研究主要集中於以下問題:人類與機器人能否在可持續交通系統概念、計算機社交或教學遊戲場景的背景下進行合作交互?二者能否進行相互幫助?以及二者能否進行彼此替換?舉例來說,在進行電腦遊戲時無法獲知遊戲對手的身份,若對手是機器人,則其行為表現應能夠與人類相似。

從這個角度來看,智能控制系統(Intelligent Control System)應能夠感知和檢測(Sense and detect)外部變化、學習(Learn)已有經驗、制定(Decide)並實施(Act)最優解決方案、以及持續進行相關工作(Stay tuned)。這些實際上均由人類行為總結所得。

若以控制系統理論對比探討機器人的功能,其應能夠感知和檢測物體、學習和處理信息、制定和實施決策、持續關注變化以及在必要時調整並適應變化。在這裡我想表述的是,人工智慧系統和控制系統並沒有什麼不同,區別僅在於專家學者通常更傾向於將其歸入兩個不同的學科領域

機器人應像控制系統由一系列對象組成,能夠保持實時運行,具有可靠性和魯棒性並能夠執行關鍵任務操作。因此,機器人不只是機器學習設備,而是認知與協同控制系統設備。

對於人類與機器人之間的複雜交互和協同系統技術在交通系統中發展的研究由人類的願景所引導,即在不久的將來無人駕駛車輛能夠與人類駕駛車輛共享道路資源。這一願景昭示了交通運輸業的新紀元,同時展望了可持續城市交通解決方案的發展前景。值得注意的是,在1991年這個願景提出時,谷歌、無人車等事物還未出現。在這一時期,研究的目標是設想交通系統的未來發展變化,以從社會需要的角度探究最佳的可行解決方案。

鑒於當時的技術發展水平不高,研究主要完成了多移動機器人協調(Cooperative Mobile Robots)的研發及後續道路測試。在2002年,成功實現了無人駕駛車輛的多車協同駕駛(Cooperative Driving V2V - driverless only)。隨後,進一步探究相同路況下無人駕駛車輛與傳統人類駕駛車輛的協同駕駛(Cooperative Driving V2V – interoperability V2I)。最後,研究進入協同智能交通系統(Cooperative Intelligent Transportation System, C-ITS)時期。

研究發展的主要動因是當前城市交通系統理念(the current urban transport system concept)並不具備可持續性,具體表現為:其未能消除由駕駛員過失引發的道路交通事故;其依賴石油且不利於環境保護和身體健康;以及因社會成員並不能擁有同等的交通系統使用權利,其有悖於社會公正。

這必然不是我希望下一代所繼承得到的生活狀況。因此,在這種強烈動機的驅使下,需特別針對智能交通系統理念和協作式智能交通系統理念的深化進行研究。

集成多模式智能交通系統(Integrated Multi-Modal Intelligent Transportation System)的主要原則包括,其應為協同的(Co-operative)、平行的(Parallel)、可靠的(Reliable)和容錯的(Fault Tolerant)並具有網路彈性(Cyber Resilient)。這也正是人工智慧與控制系統兩個領域的研究人員在制定解決方案方面的主要區別。毫無疑問,人工智慧研究人員通常能夠由新興技術方法得出解決方案,但通常來說,這類技術方法會得出多種不同的解決方案,可能即使在相同的環境條件下其也不可復現。因此,從這個角度來看,人工智慧技術對運行中時常發生的故障的容錯性不足,也不具備足夠的可靠性和魯棒性以及抵抗擾動的復原性。

正如在講座剛開始時所說,我認為控制系統的作用應為協助系統應對無法提前獲知的擾動,並且即使在擾動信號持續存在時維持整個系統的正常運行。這就是控制系統在智能交通系統運行中的期望實現目標,同時也是探究智能交通系統和網路安全攻擊問題的原因之一。因為對系統來說,網路安全攻擊與外部擾動無異,同樣屬於系統可能遭受的各類擾動之一。所以從控制系統的角度來看,應對網路安全攻擊加以研究並將其視為典型系統擾動。

在上圖所示的控制系統中,大量用戶在協同交互過程中形成了系統的配置結構。顯然,一個簡單的網路攻擊就能夠破壞系統的正常運行。

計算機科學與人工智慧領域的從業人員研究網路安全問題的目的是對系統本身進行防護以避免其受到網路安全攻擊。但事實上,網路攻擊的發生是不可避免的。而如果以控制系統理論的角度研究相同的問題,在不能避免網路攻擊的情況下,研究人員會嘗試尋找方法幫助系統應對網路攻擊、完成基本運行工作並增強其對網路攻擊的復原力。這是控制系統工程師與人工智慧研究人員兩者在解決問題方面的另一個主要區別。其主要研究思路是依據控制系統理論使控制系統在擾動的影響下學習已有經驗、維持系統正常運行以及避免系統崩潰並恢復系統穩定,這就是關鍵研究問題。

一旦一項認知與協作決策技術得到研發,其將能夠使人類與機器人以動態且可靠的方式進行交互與合作。並且,我認為只有控制系統與人工智慧交叉領域的研究人員才能成功解決這些重要問題

然而,研究有時仍需十分小心謹慎。Derek Atherton教授曾這樣說到:「毫無疑問,沒有人能夠參透人類的智慧及其衍生產物。」

通過查閱以往研究成果可以發現,許多非常受人尊敬的專家學者過去所發表的論斷在現在看來都具有明顯的錯誤,具體如上圖所示。因此,對於未來發展方向的探討具有非凡的意義。但與此同時,需要十分嚴謹地提出個人見解並接納未知變化的發生。

以上就是今天講座的所有內容。

Q&A

Q1:本人最近正在研究增強學習(reinforcement learning )在智能交通系統中控制系統的應用。我想請問教授,增強學習中的獎勵(reward)和狀態(state)未被定義為反饋是否出於某種具體原因?

A1:非常感謝提問,這個問題十分符合我想要通過此次講座表達的內容。對於研究機器人的兩類不同學術羣體,即控制系統領域的工程師和人工智慧或計算機科學領域的專家學者,其探究對象相同但通常傾向於與彼此互相區分。這就是兩者使用不同術語的原因,即使術語所代表對象的實際本質相同。因此,強化學習中的獎勵與狀態相當於控制系統中反饋信號,它們之間並不存在本質區別。

Q2:請問您是否認為人類將會被智能機器人取代?

A2:我在剛才講座中已嘗試回答了這個問題,即未來的研究發展趨勢是能夠適應人類的機器人。具體來說,即通過機器人的使用以協助人類進行工作,而非人類花費更多時間以適應協調智能設備。因此,發展應傾向於能夠滿足人類社會需求的新興技術。

毫無疑問,未來機器人的反應會更加靈敏、行動會更加迅速或是力量更加強大,甚至會出現在決策方面非常智能的機器人。但我堅信人類纔是最強大有力的規則制定主體,只有人類才能推動社會不斷發展。

Q3:以往的研究主要運用數學工具設計控制系統,我想請問何種方式更適用於目前處理社會信號的控制系統的研究,例如協同駕駛系統?模擬是否為一個合適的研究方法?

A3:模擬是能夠減少研究成本的解決方法之一,但方法理論的測試驗證是研究的必經階段。而對於數學方法的使用,應遵循多方決策制定理論。例如,針對協同駕駛系統,假設有3或4輛車在交叉路口相遇。在沒有交通信號燈指示的情況下,需應用特定的數學理論使其相互協調、分配並決定交叉路口優先路權。同時,數據工具還有利於提高解決方案的魯棒性。因此,我認為應儘可能堅持使用數學工具或方法,當然在具體應用時可對其進行簡化。


推薦閱讀:
查看原文 >>
相關文章