本文是兩年前在簡書上發表的一篇文章,現在看來貌似還是有一些前瞻性的(作害羞狀)。在這裡略作修改,增加一些這兩年對於數據採集、數據分析的新的認識。

序言

近幾年,在「工業4.0」,「中國製造2025」的洶湧浪潮中,工業領域的創新概念層出不窮,工業雲平台可能是眾多概念中比較引人關注的一個。不僅國外知名廠商,如GE、西門子等紛紛加大力度推廣自己的工業雲平台,國內的很多企業也快速跟進,希望建立更加適合中國製造業的雲平台產品。

不難看出,工業雲平台能夠大受推崇,與製造業中細分領域眾多、需求差異過大有很大關係。目前階段,大部分的廠商一般都只是在某個或某幾個製造業細分領域深耕細作、做大做強,很難通吃整個市場,因此,各家廠商都希望尋找製造業的共同痛點,推出具有普適性的產品——工業雲平台無疑是當前階段的共性選擇。

簡單來說,工業雲平台主要為工業現場數據採集、傳輸以及在雲端的數據存儲、處理及分析等各個環節提供基礎技術支撐,降低製造業企業實現信息化、智能化的技術門檻,加快相關智能製造項目的建設實施速度。

但是,工業雲平台是否能在實際應用當中完成「工業領域的互聯網操作系統」的角色定位?是否能夠達成創立之初的預期目標?是否能夠實現快速的大範圍推廣應用?筆者對此持懷疑態度。

筆者認為,短期內工業雲平台很難實現廣泛的應用,從目前的應用方式來看,製造業企業要想擁抱工業雲平台至少需要處理好兩個重要環節:

  • 數據採集:包括與設備建立通訊,獲取現場的生產運行數據
  • 數據分析:把來自生產現場的海量數據進行分析處理,形成具有可行性的生產運營改進建議

下文將以GE的Predix、西門子的MindSphere平台為例,從數據採集與數據分析兩個方面探討工業雲平台目前存在的問題。

一、數據採集

眾所周知,工業現場的數據採集一直是推進工業信息化進程中的一個難點。現場設備種類繁多,通訊協議紛繁複雜,而且一些年代久遠的設備缺乏進行網路通訊的軟硬體條件,這些都為現場設備層的數據獲取增加了很大的困難。

即使是一些自動化、信息化水平相對較高的行業,如乘用車行業,其生產現場中已有的設備以及上位機系統在數據交互方面也存在開放性不足的現象。

當初,在乍一聽說工業雲平台的概念時,筆者就非常好奇像GE、西門子這樣的工業巨頭是如何解決這一棘手的難題的,由於這方面的中文資料實在少的可憐,而且大部分資料在數據採集方面的描述也非常籠統,為此,筆者翻閱了GE與西門子發布的官方資料,總結如下:

predix的數據採集實現手段

predix已然江河日下,但是,一個predix倒下去,必然有若干個工業互聯網平台站起來。因此,還是有必要對先驅者進行一下研究。

對於predix,筆者重點查閱了包括「platform brief」以及「technical whitepaper」在內的資料。

predix平台為工業現場的數據採集以及向雲端的數據傳輸專門設計了一個功能模塊,即Predix Machine。注意,別被這個名字誤導了,Predix Machine是純粹的軟體組件

按照GE的說法,根據現場設備的不同情況,Predix Machine在工業現場有三種部署應用模式:

  • 部署在網關(gateway)。對於支持通用工業通訊協議(如modbus,opc等)或TCP/IP等IT通訊協議的設備,Predix Machine可以通過設備自身所支持的協議直接與設備進行通訊,在這種應用場景中,Predix Machine往往部署在網關上,而網關起到設備與雲之間的通訊連接作用;
  • 部署在控制器(controller)。predix machine直接部署在設備的控制單元中,這樣做能夠削弱機器軟體與硬體之間的聯繫,實現連接、可升級性、兼容性、遠程訪問等,使獨立運行或在單獨網路中運行的工業設備能夠直接連接到雲端,完成數據採集與實時分析;
  • 部署在感測器(sensor)節點。在這一應用場景中,感測器部署在生產現場,完成數據採集,直接將數據上傳至雲端,在雲端完成其他的數據處理操作。

mindsphere的數據採集實現手段

西門子的MindSphere推出時間較晚,2016年3月才有了第一個beta版本,筆者重點翻閱了產品的宣傳冊資料(Brochure)、MindSphere Getting Started、IOT 2000 Operating Instructions。

這些資料看下來,總體感覺是MindShpere資料中關於數據採集的描述相對模糊,體系也不是很清晰,筆者自行總結一下,MindShpere的數據採集主要依託nano這一網關型硬體產品,向上與MindSphere的雲端進行連接,向下與西門子的眾多具有乙太網通訊能力的硬體產品、以及支持通用協議的其他品牌產品進行通訊,完成數據採集與傳輸。如果設備的通訊協議比較特殊,用戶可以基於nano中的開源軟體自行開發設備通訊與數據採集程序。

從西門子的宣傳資料上看,主要通過以下幾種方式實現設備與MindSphere的通訊與數據傳輸:

  • MindConnect Nano
  • MindConnect IOT 2040
  • MindConnect Software
  • Integration in SIMATIC and other Siemens products

下面逐一介紹各種連接方式的具體實現:

1.MindConnect Nano

Namo這款硬體產品可以說是專為MindSphere量身打造的。從名字上看也是非常時尚,有點消費電子產品的感覺。

Nano的實質是一款嵌入式工控機,通過預先進行配置的方式與MindSphere進行連接通訊。在硬體上支持的介面主要包括USB、PCIe插槽、串口以及乙太網口。支持的通訊協議包括西門子S7系列的乙太網通訊協議以及OPC UA。nano能夠通過安全的網路連接向MindSphere傳輸加密數據,保證數據安全。Nano只能與MindSphere共同使用。

從Nano的產品介紹中可以看出,它扮演的角色類似於位於雲平台和現場設備之間的工業網關,既完成數據採集(包括建立通訊),又完成數據向雲端的加密傳輸。而且Nano這一工業網關只能用於MindSphere體系中。

2.MindConnect IOT 2040

MindShpere的宣傳資料上給出的名字叫「MindConnect IOT 2040」,但是在網站上查到的IOT 2040所歸屬的產品系列是Simatic,也就是說歸類到西門子自動化產品系列,而且從產品樣本手冊的圖片上看,其外觀樣式也秉承了西門子自動化產品的一貫風格。所以,筆者搞不清楚究竟是MindShpere資料的編寫者的筆誤,還是另有其他的產品。以下都按Simatic IOT 2040進行介紹。

這個產品在介面方面包括RS232/RS422/RS485, Ethernet和USB,並且內部提供擴展Arduino和Mini PCIe的擴展介面。

從介面上以及產品的名字IOT上來看,這款產品的定位還是作為工控設備與物聯網的連接器,因為這款產品本身秉承了SIMATIC系列產品的工藝設計,保證了在工業現場惡劣環境下的可靠性,這一點能夠彌補Arduino等物聯網開源硬體在工業強度等級上的不足,相當於給性能強大的物聯網硬體穿上一身安全服。

至於在連接性上承擔的作用,筆者認為,IOT2000所處的位置應該是位於nano與設備之間,承擔類似於協議及介面轉換的作用。直觀的感覺是,把這樣一款產品放在MindSphere體系中有點牽強,既然屬於SIMATIC系列,那麼和第四點就有些重複,也可能西門子是為了突出在物聯網領域的擴展應用吧。

3.MindConnect Software

這個軟體目前沒有查到資料,但是根據nano的產品推斷一下,可能指的就是nano中提供的免費開源軟體。通過這個開源的軟體,用戶可以自行開發所需要的通訊協議,與設備建立連接,採集數據。

4.Integration in SIMATIC and other Siemens products

西門子的自動化產品中有很多通訊模塊,比如乙太網通訊模塊,甚至有些CPU模塊中就帶有乙太網通訊的功能,因此,MindSphere可以通過Nano直接與西門子的這類產品進行集成,實現通訊與數據採集。

數據採集方面存在的問題

對於predix平台的數據採集實現手段,第一種部署在網關上和第三種與感測器結合的部署應用方式是我們比較熟悉的,第一種方式中的網關可以理解成現場經常用到的SCADA伺服器的功能——連接設備、上傳數據。第三種方式也比較好理解,對於一些不支持通訊協議的設備,加一些感測器進行數據採集。

問題主要出在第二種方式上,即部署在控制器中的方式。這一方式從技術實現角度上看不具有普適性,即,對設備的要求較高,主要體現在兩個方面:

  • 開放性要求。只有開放性比較好的設備,Predix machine才能直接部署在控制單元上,而且考慮到兼容性,控制單元內部的軟體運行環境應該是比較通用的平台,如Windows、Linux等。但是,工業現場的設備來自於多家廠商,大家出於對自身設備運行安全性、可靠性以及商業利益方面的考慮,怎麼會願意在自己的設備上運行其他公司的軟體,這就導致了大部分設備的開放性無法滿足predix machine的要求。
  • 高性能要求。首先聲明,這一點是筆者的猜測,並沒有官方說法支持。Predix Machine應該是功能強大、但同時對硬體資源(包括CPU、內存等)要求也較高的軟體組件,因此,能夠部署predix machine的設備,其核心的控制單元需要硬體配置較高,一些單片機、嵌入式系統恐怕難以勝任。

與GE的Predix相比,MindSpere提出了更加完整的數據採集解決方案,即提供了完善的網關產品nano,應該說這樣的設計更加貼近工業現場的實際情況,因此,筆者更加看好MindSphere,但是MindSphere也存在如下兩方面問題

  • 成本問題。由於MindSphere與nano的深度綁定,因此,要想使用MindSphere,就必須購買nano硬體,nano的作用無可替代,這無疑增加了採購成本;
  • 兼容性問題。西門子在設計MindSphere與現場設備的連接通訊功能時,充分利用了其在工業自動化領域的優勢,更多支持的是西門子自己的工控產品,對於其他品牌的產品,如果採用的是非通用協議,就會出現兼容性的問題,當然,這一問題一直都是工業現場數據採集的難題,我們也不能對西門子求全責備。而且MindSphere也提供了方便用戶自行開發通訊協議的軟體基礎,只不過這樣會提高用戶的應用要求,延長項目的實施周期。

關於數據採集的進一步思考

GE在做產品功能設計的時候為什麼對predix應用的硬體環境有這麼高的要求呢?筆者認為,這與GE公司的背景、predix的產品定位有很大的關係。

  • 美國人強大的IT技術背景。GE是一家美國公司,而美國是全世界IT技術最為先進的國家,相應的設備信息化、智能化程度也較高,甚至對於一些老舊設備,也可以利用其先進的IT技術進行改造,提升通訊和數據處理能力,比如,intel推出的專為物聯網打造的Edison平台,就完全可以嵌入到其他設備當中,而且價格低廉、體積小巧、性能強大;
  • predix的「工業互聯網」平台的產品定位。德國人的概念是「工業4.0」,從設備層向信息系統、雲端擴展,自下而上構建未來工業發展體系;而美國人剛好相反,提出「工業互聯網」,強調的是從信息系統向設備層滲透,這也是充分發揮IT技術優勢的必然選擇,這一選擇也就導致了對工業現場設備在開放性及性能方面的要求。

而西門子本質上還是工業硬體產品廠商,它的控制器等產品在市場上佔據很大的份額,即使推出工業雲平台,也與自己的硬體產品nano緊密地綁定在一起,其目的還是要兜售自己從硬體到軟體、從自動化到信息化智能化的一體化解決方案。這家德國公司是絕對不會放棄自己在硬體設備方面的優勢的,正如前文講到的,西門子的思路與GE剛好相反,西門子一直是立足工業設備,逐步向信息系統延伸。

關於設備連接性的補充

在設備連接性方面,predix和mindsphere支持的通訊協議種類都比較有限,遠不如一些SCADA產品、數據採集組件(如KEPWare)等。因此,在用工業雲平台進行設備聯網時,可以考慮應用上述的SCADA產品、數據採集組件,將設備層的通訊協議轉化為OPC等工業雲平台所支持的協議。用這種方式要比在工業雲平台的基礎上自行開發相關協議通訊模塊的方式更為高效、穩定,甚至更加節省成本,因為市面上的SCADA產品、數據採集組件等都已經非常成熟穩定,而且價格也並不高。

二、數據分析

正如GE宣傳的那樣,數據分析是真正能產生價值的功能,數據分析實現了從數據到信息,再由信息到具有可操作性的生產運營改進措施的過程。當然,這是理想中的情況。

數據分析這部分之所以引人關注,也與現狀有關,大部分的工業現場對於數據的分析挖掘還遠遠不夠。

筆者翻閱了GE和西門子的資料,將兩家巨頭在數據分析方面的做法總結如下:

predix的數據分析實現手段

在數據分析方面,predix提供了包括Asset Services(設備服務)、Data Services(數據服務)、Analytics Services(分析服務)在內的一系列服務。

分析過程是,predix先通過設備服務為設備建模,再通過數據服務將採集的設備運行數據與來自其他的數據源的數據(包括設備模型、ERP數據)相結合,並根據數據的特點存儲到不同類型的資料庫中,最後採用分析服務對數據進行分析,輸出分析結果。

predix的分析服務提供兩種類型的數據分析,Operational analytics(操作數據分析)以及Historical analytics(歷史數據分析)。操作數據分析,實質是實時數據分析,對設備的狀態變化進行實時分析與響應。歷史數據分析,是對海量歷史數據進行分析,進而建立設備預測性維護模型。

對於分析來說,最重要的是模型的建立。而predix分析服務提供的是一個框架,這個框架用於開發及嵌入高級分析演算法到程序運行中,這個框架通過配置、抽象以及擴展模型,用於管理分析演算法的執行。當然,在predix這個框架內已經具備了一些分析的演算法與模型,根據資料中列舉的例子,筆者推斷,這些演算法應該主要來自於GE在某些領域,如醫療,航空發動機等,積累的一些經驗。

mindsphere的數據分析實現手段

關於MindSphere的數據分析功能,沒有查到特別詳盡的資料,只知道融合了西門子之前推出Sinalytics分析平台的功能。筆者推測,MindSphere的數據分析功能的實現應該與predix大同小異,即搭建完整的大數據預處理、存儲及分析的技術框架,也融合了西門子以前在若干個領域積累的分析模型與演算法,也提供開放的介面,便於用戶嵌入滿足個性化需求的分析演算法模型。

數據分析方面存在的問題

分析模型的缺失。在這一點上predix與MindSphere的問題是類似的,兩者都是開放的平台,在分析服務功能中,支持第三方開發的分析演算法的嵌入。這主要是由於製造業的細分領域太多,任何平台都難以做到大而全,因此,GE和西門子把這部分功能開放出來,讓用戶根據自身的實際需求,將自己的經驗轉化成分析演算法與模型,加入到平台的分析功能中。但是在實際應用中,製造業的廣大用戶是很難自行設計分析模型的,要完成這一工作,需要用戶具備IT(如機器學習)、設備、生產工藝等多個領域的知識,絕大部分製造業從業人員的技術水平恐怕還難以達到這樣的高度。因此,目前階段,用戶在使用predix或者MindSphere的分析功能時,恐怕只能停留在輸出一些統計結果與簡單的對比分析階段。

當然,國內大部分的工業現場信息化水平不高,沒有歷史數據的積累,這也是造成分析模型(如設備故障的預測模型)難以建立的重要原因之一。

三、結語

工業雲平台在數據採集及數據分析兩個方面存在的問題,歸根結底還是由製造業領域生產設備及業務需求的巨大差異性造成的。儘管筆者不看好工業雲平台在短期內的發展,但長期來看,隨著製造業整體信息化水平的提高,包括生產設備通訊能力的加強(通訊介面、協議的標準化),製造業從業人員綜合能力的不斷提升,以及大數據、機器學習等先進IT技術在製造業的不斷深入應用,提供基礎技術支持的工業雲平台必將擁有更加廣闊的應用空間。

對於工業雲平台的使用,雖然不易,但仍然要愛,因為,曲折道路的盡頭必定是光明的未來。


歡迎轉載,轉載請註明出處。

微信公眾號:聊聊智能製造那些事。

歡迎一起探討智能製造和物聯網。


推薦閱讀:
相关文章