2017中國開源產業峰會暨中國國際軟體博覽會分論壇,優雲軟體葉帥在開源雲計算技術創新論壇發表了《「互聯網+」時代的雲數據中心運維思辨》的主題演講,本文根據演講內容整理而成。如果需要了解優雲全線產品,可登陸官方網站(www.uyun.cn)進行註冊,免費試用SAAS版。

無論是穩態還是敏態,大家關注的內容最終的目標並不會發生變化,最終的目標都是保證當前的數據、業務或者用戶能夠得到一個比較好的系統體驗,是不是說隨著雲環境或者容器對象的引入,當前的IT對象或者IT服務就能夠得到持續的比較好的體驗呢?其實往往不是這樣的。

隨著業務系統或者整個IT架構發生一個複雜的變化,要管理的內容也變得越來越多,以前只是單純地維護網路,維護存儲,維護操作系統,維護我們的數據控制原件就可以了。那麼隨著虛擬化、容器應用的這樣一個引入,我們發現更多的IT架構是發生瞬時變化的,很可能容器對象在伺服器A下一刻就到伺服器B去了,導致我們要花很大的力氣去做整體業務可用性的一個盤查,這樣的難度也越來越大。

那麼如何能夠保證用戶得到比較好的一個效果,而我們的業務還能持續運行,這其實是我們要考慮的事情。廣通軟體提出了一個應用端到端的管理思路,這個應用端到端的管理思路跟傳統的這種APM監控或者PPM監控略有不同。

傳統的監控更多的還是關注工具層面,單獨工具或者單一工具它所獲得的信息內容,而廣通軟體的這個應用端到端的管理,不僅能夠去捕捉到某個不滿意用戶的總體訪問情況,哪些不滿用戶它的那個慢交易在什麼地方,還能夠對這個用戶的慢交易進行過程的回溯甚至是定位到這個慢交易是在哪段代碼中、哪個資料庫中出現了問題,做到一個前端跟後端的關聯,這個是我們認為端到端應該做的一個事情,而不是局限於應用層或者僅局限於數據層、用戶體驗層面的一個內容。

我們要打通從用戶體驗到數據到應用到底層架構的這樣四層關聯,那這個是我們在應用監控方面的一個內容。

接下來就提到了我們的第三個內容,有了資源管理,也有了監控管理,那麼這些有沒有很好的去解決當前運營的一些問題呢,它只能夠保證在運維被動式響應的場景能夠得到很好的一個改善,達到一個主動式的運維。那麼如何能夠把運維從主動式轉到一種運維效能或者服務交付式運維呢,我們提出了自動化處置的一個概念。過去傳統的自動化運維關注的內容是包含了像我們的巡檢、合規性檢查、日誌分析數據遷移的一些內容,過去關注的內容更多是對於操作系統對象層面的日常巡檢或日常關注的一個運維交付。那麼我們在敏態環境下,在當前雲環境和「互聯網+」下面我們更多的通過自動化運維,要做的事情是把DevOps的一個從代碼構建到代碼發布,到最後持續運維、運營都納進來。所以說我們當前所關注的敏態下的自動化運維,它更多的是從持續交付到整個系統的彈性發布,甚至是故障自愈達到這樣目的。

我們把整個運維過程進行拆分,定義每個過程或者每個場景是我們整個運維生產線上的一個原子化操作,那麼我們把這個原子化操作進行生產鏈的組合,保證它是整個木桶,沒有任何短板,而且整個木桶的銜接也是沒有任何問題的。那麼通過編排把這些定義好的原子化操作進行場景化的示例,進行產品化示例之後,進行快速的交付,交付就可以通過監控驅動或者流程驅動或者人工驅動等諸多方式來保證自動化的這種快速的應用,這個是我們自動化的一個思路。

那麼自動化應用在什麼地方?其實自動化更多的是應用在一些比較大的數據中心。我們來給大家算筆賬,一台伺服器從系統部署到最後的監控告警大概需要30分鐘,那麼如果我們有一百台甚至是一千台伺服器,這就會是一件很可怕的事情,我們測算了一下擴容一千台伺服器大概需要2個人工作一個月的時間,這會非常消耗人力。

自動化的方式能夠應用在需求調研、例行操作、響應支持、優化改善等等,我們把自動化操作通過場景的映射,把每個場景定義成不同原子化的過程,進行快速的發布,這個就是我們的自動化的一個內容。

那麼我們說整個信息發展或者技術發展遵循的路線都是先通過高精尖的技術去完善工具,當完善工具之後,那麼工具會形成一個打通平台的內容,當有平台之後人會參與工具之中,人會參與平台之中,實現人與工具,人與平台的對話。那麼最後我們在這邊簡單的提一下對於運維的一個展望和對未來發展的理解,廣通軟體認為人工智慧肯定是最後運維發展的一個終極目標,那麼人工智慧包含了人與機器、機器與機器,人與人之間的快速協同,我們把它稱之為ChatOps,這種即時協同的方式來去做我們快速的一個交付。

我們的這種即時協作可以廣泛應用在我們的環境部署、故障排查以及相關的功能交付,涵蓋了監控到資源管理到整個自動化的所有運維場景,能夠幫助我們的人員進行快速下達指令,能夠進行一個快速執行。那麼運維的即時協作,更多的是通過創建人工的工作組的方式來成立專項的PMO,在專項PMO裡面我們以人為本,人員通過智能語意的方式對機器人進行語義的下達,比方說讓它去擴容某個表空間,那麼智能機器人就識別了這樣的一個語義,它就可以去調用自動化的工具去做這個事情。

那麼通過ChatOps可以想像到這樣的一個人與機器的協作最終的目標是降低人員對於運維工具的過分依賴,通過命令的方式讓不具備全棧運維的人員也能參與進來,只要有這個許可權,只要有這個知識,那麼就可以下達這個命令,由機器來幫助執行。

通過設立不同的專項組,我們成立了運維專題,那麼在運維專題裡面可以查看當前的配置項,甚至是把這個配置上的一個消費圈訂閱到比較醒目的看板上,同時也可以去查看性能狀態、監控狀態,也可以去執行一些故障恢復的腳本,查看一些監控報警等等。這個其實就是我們整體的一個運維發展未來遠景的規劃,就是通過智能語意、智能技術來幫助我們實現面向未來智能時代的一個人員與運維的快速結合。

廣通軟體過去是做傳統運維的,那麼現在更多是幫助用戶實現「數字化」與「互聯網+」時代下的IT運維快速的迭代,幫助他們去穩步適應ITIL和DevOps的衝擊,那這個就是本次演講的內容,非常感謝各位.

觀眾提問:

老師好,現在互聯網比較流行這種微服務架構,就是目前我們一些傳統企業包括金融行業也是把自己的互聯網部分逐漸的在微服務化,大家也知道微服務不像以前的那種通過企業匯流排統一去交付,而是去相應的服務引擎那一塊去發現這個服務,然後就實現一個大範圍網狀的一個交付,對於這種架構的話我們有沒有一些相應的策略或者方案。

葉帥回答:

對於互聯網現在我們用的比較多的這種微服務架構,首先第一個微服務架構是通過網關的方式來實現或者通過OpenAPI的方式來去實現我們整個數據的互通,數據的交互,那麼我們現在提到的運維Pass平台也是基於微服務的架構去做的這個內容,那麼我們通過兩方面來實現整個微服務的管理,第一個方面是通過比較基礎的一個日誌方面進行管理,第二個是通過埠鏡像的方式去做網路報文的一個跟蹤,因為它是通過OpenAPI的方式來去做整個消息的這樣一個互通,所以通過報文的方式來去捕捉,來去解析整個數據傳輸或者整個數據交互的一個內容是更為合適的。


推薦閱讀:
相关文章