導讀:工業互聯網技術,是物聯網技術、云邊協同、數據庫、實時計算等領域的綜合應用場景。本文會從工程實踐角度,講述智能制造數字化賦能轉型的角度,并結合智能制造轉型應用案例,端到端地講述阿里云IoT對工業上云整體方案的系統設計和實踐心得。主要內容包括:① 工業數據上云背景與整體方案介紹;② 核心技術環節和優化心得;③ 工業數據應用案例介紹。
01工業數據上云背景與整體方案介紹
1. 工業數據上云的意義
工業互聯網,是繼消費互聯網后又一個重要的應用場景,在全球范圍內得到了普及推廣。
拋開國內制造企業、業主等類型單位對工業數據上云的成本、產出效益方面的擔憂,工業數據上云的主要意義在于:利用云的開放靈活度、分布式、可擴展等特點,打破傳統工廠在工業化、信息化方案中的標準封閉、碎片化、孤島問題,實現OT和IT的融合。具體包括:
2. 工業數據上云面臨的挑戰
對于工業數據,可從OT域和IT域兩個角度入手:
① OT域——工業設備時序數據實時上云的挑戰
相比于智能家居等消費型智能設備,制造業產業普遍自動化程度較高,然而設備更加專業化和封閉化:適配協議多,采集頻率高,數據量大,非標設備多;因此需要搭建統一的、具有兼容性的數據匯集網關,做好底層建設,制定針對性的云邊一體化方案。
工業產線設備和消費級智能設備的對比如左圖所示。
② IT域——工業離線數據集成挑戰
除了上述的OT域所面臨的挑戰外,在IT域同樣面臨不小的挑戰。
右圖是一個典型的工廠信息化進程。從圖中可以看出,工業企業采購的IT系統之間通常是不能數據互通的,因此工業IT存多源異構系統特別多、數據格式不統一、碎片化嚴重。基于這樣的情況,將各類數據匯聚起來做商業分析、經營報表等是非常困難的;因此需要配套離線的數據集成方案,去解決上述諸多IT域存在的問題。
3. 工業數據上云整體架構
如前文所述,工業數據上云的價值在于:幫助制造企業實現企業內部從設備、控制系統及信息系統的互聯和數據融合,最終實現數據驅動業務與運營優化;然而其存在諸多的技術挑戰,主要在于:工業邊緣采集+建模、海量數據上云、異構數據集成、數據融合分析等。
基于上述種種現狀,阿里云IoT事業部工業互聯網團隊聯合阿里云物聯網平臺以及邊緣計算團隊、容器服務團隊,共同研發了一套工業數據組合應用平臺,專用于解決工業企業大規模點位設備數據快速上云這類問題,并結合工業典型場景提供諸如數據資產服務、業務應用服務、數據融合服務等。整體架構如下:
基于阿里云物聯網、云技術和工業大數據技術等,阿里云數字工廠構建了一套相關的解決方案:利用數字化控制管理資源,收集分析歷史數據,并基于分析結果進行業務決策和優化技術。(可在阿里云主頁搜索“數字工廠”查看詳情)
4. 工業數據上云核心鏈路
工業數據通過采集器采集數據,獲取設備的運行狀態。工業產線大多是通過PLC或DSC實現自動化控制,因此工業邊緣網關的主要目標是讀取數據并進行模型化處理、格式化組織并上云。
這一部分的關鍵點在于,根據數據的實時性以及數據類型,進行分層處理,實現設備實時消息采集上云+云邊離線數據集成:
02核心技術環節和優化心得
1. 工業多協議兼容的邊緣計算一體機
① 在工業生產現場,通過部署阿里云邊緣計算一體機,實現高實時高流量高可靠的數據接入、就近計算、算法推理
使用阿里云邊緣一體機,為客戶提供邊緣計算基礎設施,具體包括以下特性:
② 在工業數據上云場景的邊緣計算應用架構
2. 工業設備實時數據的模型化處理
① 阿里云物模型介紹
阿里云物聯網平臺物模型,在智能消費類設備領域大規模推廣,沉淀了屬性、事件、服務標準定義;又在園區、城市、工業等場景中不斷增強,演化出組合、引用、規則等復雜模型特性,最終具備數字孿生體的建模、協同、共智核心特征。
阿里云物聯網平臺物模型2.0增加了物模型規則,可計算包括物模型自身功能定義之間的運算和跨物模型功能定義之間的計算。
下圖的左圖就是一個最簡單的物模型轉換規則:將攝氏度轉換為華氏度。
傳統的工控自動化背后,是很多小規模、封閉、獨立的自控系統,在工業實施的過程中,需要專有的系統或協議層的訪問,而且難以復用。基于阿里云工業協議網關配合物聯網平臺物模型規范,可以實現現實通信協議和設備模型之間的解耦。通過物模型,站在整個企業視角對工業設備進行統一的自上而下下建模,從實踐中看到有如下收益:
上圖為工業設備數據在數據采集上云過程中的不同處理階段
② 物模型應用案例
物聯網應用開發,是阿里云針對物聯網場景提供的生產力工具,是阿里云物聯網平臺的一部分,可覆蓋各個物聯網行業核心應用場景。
對于工業場景,在接入物模型設備后,開發者可以借助IoT Studio快速搭建工業云組態視圖。
③ 工業數據模型化帶來的技術挑戰
傳統的數采方案主要包括采集、存儲、就近計算、流轉上云這4個主要的步驟。如上所說,我們在常規的消息處理的過程中增加了一個模型化的步驟,在具備了物模型能力的同時,也帶來了如下的技術挑戰:
上圖中左側部分是原始時序數據點位,右側部分是模型化后的JSON的表達方式。為解決模型化后的傳輸、處理問題,降低上云成本,需要利用邊緣側算力,就近完成模型預處理工作。
與此同時,針對模型化數據的邊緣數據上云通道的傳輸協議、編碼方案,也需要做一系列的針對性優化。
3. 邊緣數據上云通道設計
① 在邊緣側對設備的模型化消息進行數據預處理,提升上云效率。
現實中單個工廠邊緣上報的數據峰值經常達到10W點/秒以上,對上云吞吐量要求高,如果用原始設備JSON模型消息傳輸,會占用很大的上行帶寬(>200Mbps);
而通過在邊緣側做前置預處理、云邊協同編解碼等優化手段,實測上云帶寬和云上處理QPS降低80%,為客戶節約了大量的上云資源費用。具體包括以下優化點:
② 設備實時數據消息聚合重排方案介紹
所謂消息聚合重排,是指邊緣側接收底層上送的離散設備消息,按指定的間隔窗口聚合為同一設備同一屬性的一段時序數據,提升單條消息的數據排列效率,也有利于云端對設備消息進行批處理。
③ 數字序列化和壓縮方案介紹
當前的工業數據上云鏈路,是基于阿里云企業級物聯網平臺提供的mqtt協議通道。如果基于普通的明文JSON格式直接序列化傳輸,字節效率偏低;因此需要針對工業場景,選擇合適的序列化/壓縮方案。
首先考慮的,是采用一種緊湊的序列化編碼方案替換JON格式,例如 protobuf/tlv,但這類序列化方案存在各自的問題:
另一種思路,是在云邊MQTT協議通道的 client-server間協商支持一種通用的zip/unzip壓縮算法,可考慮的壓縮策略有:
選擇序列化/壓縮方案主要考慮資源消耗、壓縮率和云邊兩端的實現復雜度;通過多方權衡,目前采用阿里云物聯網平臺支持MQTT通道提供的Zib壓縮方案。
Zlib:對 DEFLATE算法的一種封裝,先用LZ77算法預處理,然后用霍夫曼編碼對壓縮后的 literal、length、distance編碼優化如今最流行的通用壓縮算法之一。
④ 斷網/斷點續傳方案介紹
解決數據上云時遇到網絡中斷或者網絡抖動等情況,在對沒有上送云端的數據進行本地存儲,在探測到網絡恢復后進行數據的上云恢復。利用斷網續傳相關的SDK能力,適配各種斷網場景下的可靠性保障。
4. 工業設備實時數據云上流轉
工業設備實時數據上云,基于的是阿里云企業級物聯網平臺提供的MQTT協議通道,可支撐海量設備連接和海量物聯消息上云,同時支持實時規則處理與消息多路流轉。
對于工業場景,推薦使用物聯網平臺連接型實例,可獨享設備接入層的網絡和計算資源,適合大點位數據(高帶寬、高QPS)上云。
5. 工業離線數據集成方案
前文講述了工業設備OT域的數據實時上云方案;接下來講述IT域的數據上云方案。前文說到,設備IT域的數據,主要是存量化本地的IT系統。因此,IT域的數據上云,主要包括以下步驟:
6. 本地多源異構數據集成工具設計
在工業場景復雜的異構系統環境下,傳統ETL工具或者數據集成平臺,很難直接做為快速打通企業存量系統和云上系統的數據通道。因此,我們做了一個更貼合工業場景的邊緣數據集成平臺-工業八爪魚。
為達到工業場景低成本快速數據上云的要求,工業八爪魚有強大的邊緣ETL能力,也就是多種數據源采集、靈活的數據轉換方法、安全高速的數據傳輸通道,同時,我們希望能夠最大限度的減少項目實施的重復開發過程,這就要求這個平臺還有沉淀模板化的能力。
工業八爪魚的核心模塊,主要是本地數據的增量同步,以及同步過程中的腳本化轉換規則
為什么選擇在邊緣端運行腳本?這里主要考慮到三個問題:
03工業數據應用案例介紹
1. 工業代表落地案例——某流程型制造大型企業數字化轉型
2. 工業數據應用案例——生產過程追溯
質量是制造業的生命線,"人"、"機"、"料"、"法"、"環" 是成產過程影響產品質量的關鍵因素,采用IoT信息化方式自動采集這些因素數據,把IOT物聯網采集的設備數據與工廠業務數據進行關聯,能夠正向追溯成品使用了哪些半成品和原料的批次或者單體,也能反向追溯原材料到半成品和成品的批次或者單體。能夠在追溯過程中重新生產過程中的“人、機、料、法、環”等多種因素的原始數據
人:這個工序中每個步驟是誰操作的
機:唯一標識的物料在每個步驟是哪臺設備生產
料:原料、輔料、半成品在設備或步驟中的投料時間和數量
法:關聯到設備采集的工藝過程參數,以及質量判斷結果
環:按照工廠模型綁定的環境過程信息
把生產過程數據形成一套關聯模型,我們可以基于這套數據做數據分析,比如正向追溯、反向追溯、質量結果分析等。例如當產品出現質量問題,能夠清楚的知道產品的生產時間、工藝步驟參數、對應的物聯網設備參數信息、消耗的物料情況、產品對應的環境數據等,能防止缺陷擴散和準確定位問題,提高產品質量,維護品牌形象。
當然,有時候我們也并不特別清楚這樣一套數據模型應用場景,可以通過開放數據讓客戶找到具體應用場景,盡量挖掘數據價值。比如產品不合格時,是否由于設備參數異常導致、是否由于環境數據異常導致。
3. 工業數據應用案例——基于振動分析的設備異常檢測
工業設備中存在大量旋轉和往復運動部件,設備運行過程中會持續產生振動信號,這些振動信號往往蘊含著豐富的信息,可以反映關鍵部件甚至設備整體的運行狀態或健康狀態
選擇軸承一段時期內的振動數據,共計N段采樣信號,這里面主要用到了無監督學習,信號無任何標注,可獲得若干異常段信號特征點,最終是要識別信號中是否出現軸承受沖擊帶來的振幅突變,以及是否由于磨損帶來的中心頻率偏移。此類設備異常檢測算法可為工業生產帶來實際價值:
今天的分享就到這里,謝謝大家。
分享嘉賓:
分享嘉賓:張起彤 阿里云 物聯網架構師
編輯整理:王吉東 昆侖數據
出品平臺:DataFunTalk