• <noscript id="s46oo"></noscript>
  • <table id="s46oo"></table><table id="s46oo"><source id="s46oo"></source></table>
  • <td id="s46oo"></td><td id="s46oo"><kbd id="s46oo"></kbd></td>
  • 智物聯,引領工業物聯

    我們始終以技術創新創造價值,并夜以繼日的將互聯和工業智能的力量融入到各行各業
    以前所未見的高度、速度、精度和深度,讓關鍵所在 逐一實現。

    咨詢服務

    智物聯INDASS數據分析之謎


    【摘要】: 智物聯一直致力于提供完整的端到端的工業物聯網解決方案,并持續優化大數據分析、人工智能等創新技術,讓更多制造企業能夠有更適合的技術資源為企業提供優化策略,以提高設備運行效率。

    智物聯

    智物聯一直致力于提供完整的端到端的工業物聯網解決方案,并持續優化大數據分析、人工智能等創新技術,讓更多制造企業能夠有更適合的技術資源為企業提供優化策略,以提高設備管理效率和市場競爭力。

    那么,智物聯的大數據分析是如何提出優化方案的呢?今天,由智物聯算法工程師為大家揭開數據分析之謎。

    數據之美——數據表征映像
    不同的參數、變量所代表的意義不同,數值上的差距也會很大,例如,人的正常體溫大約是36℃、標準大氣壓是100 kPa、引擎轉速可以達到10000轉/分等等。我們都知道,數值有單位的限制,才有物理意義,但在綜合分析上,數據數值本身大小反而會產生誤導,所以需要提取數據的表征。

    對于一個設備的參數,無論變化多大,總會有一個范圍,比如:氣溫會在-10℃~40℃的范圍,不會無故直接跳到100℃,所以我們可以這樣想,把-10℃當作0、把40℃當作1、中間的溫度數均勻分布在0~1之間,此時數據單位的影響就被去除,這就完成了一個表征的提取。

    對于多個參數,我們都可以分別做表征的提取,這就方便了我們把它們放在一起觀察、考察和直觀分析。圖1是一柴油機的雷達圖(Spider Diagram)。 雷達圖的構造就是一系列數據構成,這樣我們可以同時表示出多個數據。
    圖1

    設備狀態映像圖正是雷達圖,如果選擇需要顯示10 個參數的,那么雷達圖就有 10 個分支;每個參數的顯示值是該設備的實時參數數值。這個圖展示的是設備原始數據, 直覺告訴我們,如果這個圖看上去“圓潤”或呈現較規則形狀, 那此時就是一組好數據;如果這個圖看上去“別扭”(如圖2),那此時就一定不是很好的數據。

    圖2

    參數的代表——主題綜合評價指數
    數據分析領域中的一個很重要的事情,就是參數的提煉、數據的簡化。對于一個設備來說,參數是眾多的,時刻監測所有參數會產生極大的工作量,這就需要用一個代表值來評價所有參數的總體情況。譬如:跳水比賽中,打分都會以“去掉一個最大值去掉一個最小值再平均”的方法得出最終得分,這個最終分數在這跳水事件中就是主題綜合評價指數。

    運行指數是利用主觀權重計算方法(例如層次分析法等)確定各個參數的權重之后對參數進行加權平均得到的一個綜合數值;運行指數即主題綜合評價指數,是對所有參數實時的一個綜合評價,表示整體所處的狀態,是對所有參數的一個濃縮,每一個參數的變化都會對指數造成影響,所以指數一旦出現異常數值,說明某一個或者幾個參數出現突變值,我們也就可以從指數各方向上的梯度和累積效應中發現可能突變的參數。

    指數梯度是指數關于各個參數的梯度,每個方向上的值都是指數對于各個參數方向的偏差分。當某個指數向上波動的時候,該參數的點將向外突出;當某參數向下波動的時候,參數的點將向內凹陷。中間的數值是綜合指數梯度,表示整體的指數梯度的變化,是指數對于時間的后向差分,這個值標志設備參數整體變化幅度。

    圖3

    指數累計效應指的是指數的變化能力,各方向的累積效應為指數關于各個方向上的二階偏向差分。綜合指數累積效應是各個參數的綜合變化量,是指數關于時間的二階后向差分,若該數值為正,則代表上一期的綜合指數梯度比這一期大,該數值為負,則代表上一期的綜合指數梯度比這一期小。

    圖4

    不倒翁的秘密——綜合穩定性
    整體穩定性代表的是整個設備的運行能力,是各個參數獨立穩定性的綜合值。如果一個設備一直在運行,我們只重點關注其中4項參數(例如溫度、壓力、振動頻率、振動幅度),這些參數運行時變化不大,設備就這么運行著,終于有?天, 設備崩潰了。還是同樣的一臺設備,這4個參數就像過山車,忽高忽低,總覺得設備快不行了,但它還一直運行著,直到之前那臺穩如泰山的設備都崩潰了,這臺設備還在運行,這又是為什么?

    第一臺所謂穩定的設備之所以會崩潰,是因為有其他參數發生了變化,我們關注的4個參數里并沒有這個參數,有可能由于這4個參數的持續累積效應,導致另一個參數變化;第二臺不穩定的設備沒有崩潰,是因為盡管參數變化波動很大,要么這4個參數獨立穩定性差,但是整體穩定性好;要么這4個參數的波動變化,并沒有明顯的累積效應,因此沒有影響到另一個我們并沒有關注的參數。

    運行穩定性曲線是由穩定性指數得出的曲線,表明了該設備在歷史的一段時間內的工作狀態。其數值是考察各個無量綱化后參數的方差、方向方差變化梯度、方向方差累積效應和相對變化特征四者算術平均后的一個參考值。 

     圖5

    當穩定性指數為 100 時,則代表設備運行非常穩定。當穩定性指數低于60甚至接近 0 時,則代表設備運行非常不穩定。
    相對變化特征是關聯圖譜的特征表現,這種內在聯系分為正相關性、無相關性和反相關性。所謂正相關就是一個參數增加時另一個參數也對應增加,亦步亦趨;負相關則相反,一個參數增加時另一個參數減少。

    圖6

    圖譜中每個圓點代表了他們之間的關系的程度,圓點的顏色越紅,則代表兩個參數之間的正相關性越大;圓點的顏色越藍,則代表了兩個參數之間的負相關性越大;當圓點為白色時,則代表這兩個參數之間沒有任何關系。

    勢在必行——獨立運行趨勢
    自智物聯大數據分析面世以來,為我們贏得了更多的合作機會,它將工業物聯網、云技術、人工智能等前沿技術更好地整合在一起,讓設備的運行效率成倍提升。但要讓大數據應用到更多復雜的工業領域,還需走更長的路程。工業數據在設備正常運行時是連續且有規律的,只要抓住這個規律,推測出未來的數據和危險情況,則可以事先作出措施以免造成設備異常或故障。

    圖7

    趨勢是利用現有的關于時間的數據,尋找其變化規律,再根據其變化情況,推測出未來可能會出現的數值。實際上,趨勢研究本身包括兩個方面:一是如果不受外界干擾,趨勢會怎么樣;二是如果受到外界干擾, 趨勢又會怎么樣。對于工業設備而言,有兩個較大的困難,一個是研究對象本身機理的定量描述;二是研究對象內部各因素之間相互影響、相互作用關系的定量描述。

    由于考慮的是時間上的數據,其變化就跟時間的屬性相關,晝夜季節都是影響因素,形成周期變化,也會由于累積導致數值不平穩,綜合起來就有了趨勢,也就可以進行預測。

    中短期數據可以看作是由一個直線方向、一個周期震蕩和一個服從正態分布的誤差組合而成,利用廣義線性回歸將數據最小二乘擬合成目標函數,并帶入未來時間進行預測。

    趨勢的計算方法,都是利用離散點進行建立和計算的,也就是說,利用最近的m個樣本,t1~tm時刻計算出tm+1  ,并利用m+1個樣本,推算出下一個;然后根據采樣周期推算時間。數據采樣是有周期的,比如30秒一次,那么取最近10次樣本,可以認為是最近300秒的樣本。利用趨勢模型計算出下一個,我們可以認為是從現在開始到30秒的這個預測區間的趨勢。

    得到參數關于時間的函數后,分別取10 Min、30 Min、60 Min后的值,并預測了該參數可能達到的最小值、最大值、平均值和準確率。最大值為該參數在該時刻會達到的最大范圍,最小值為該參數可能會達到的最小范圍,平均值為未來時間段的平均值,準確率為達到預測值的可能性,是關于累積誤差的函數,誤差累積得越快,準確率將降低得越快。

    圖8

    命懸一線——綜合風險分析
    對于工業設備來說,安全生產是企業重要的關注點。設備使用者希望知道此時設備是否會發生異常和故障,或者說發生異常和故障的概率有多大,以便提前做好預防措施。風險狀態是利用布豐投針實驗演化出的一個風險模擬,展示了當前設備的風險狀態。這個先建立幾個重要的基本假設:
    1.我們把平行線當做是觸發風險的“界限”;
    2.平行線之間的距離,就是設備可能的運行范圍;
    3.針的中心,就是當前的實際運行狀態(數據);
    4.針的長度,就是運行狀態(數據)實際的波動幅度和范圍;
    5.針與平行線的夾角,就是當前實際運行狀態中,實際受到的關聯作用和影響;
    6.如果針與平行線不相交,我們認為出現風險的可能性很低;
    7.如果針與平行線相交,我們認為出現風險的可能性很高。

    假設只有一個參數X,允許范圍是120~200;那么,平行線距離L=80;X當前值是186,最近300個周期的波動范圍是162~202,那“針”的長度為  D=40。

    圖9

    在考慮多個參數的情況下,可以計算和規定,綜合風險邊界值為100,表示該設備正常運行的危險邊界;綜合風險值為0時為該設備工作時沒有任何風險。藍色的線為下一刻風險可能達到的值,當藍色的線與風險值為100 的線相交時候,要提高警惕以避免造成不可彌補的損失。

    漸入佳境——目標優化方案
    在智物聯數學分析專家看來,設備的運行并不會完全按照設計者和使用者的想法進行,節能減排隨心所欲、參數一直保持最優期望值是很難辦到的。現實中往往存在著一系列無法直接主觀控制的目標,目標值、目標元素又和參數之間存在一定的機理,通過控制這些參數,間接改變目標元素,形成目標優化。優化的實質其實是希望對某一些可控制參數作出調整,實現對另外一些不可直接控制的參數的預計調整。例如鍋爐的燃燒效率與氧含量直接相關,如果氧含量過低,會造成不完全燃燒,燃燒效率自然不高;氧含量過高,代表輸入的空氣過量,雖然完全燃燒,但氣體過多會帶走熱量,燃燒效率也不高,所以,調節可控制參數氧含量也間接調整了希望優化的目標燃燒效率。

    由Weierstrass定理,閉區間上的連續函數可用多項式級數一致逼近。這意味著機理就利用多元多項式代替,故采用多元多項式回歸,求出優化目標參數和可控設備參數的內在關系,得出調整目標參數的優化方案。所以,我們總結出優化目標的五大步驟:1.首先是要確定關鍵元素,就是我們需要優化的目標元素(方向);2.分析目標元素方向上,是否具有一定的“偏度” 以確定優化是否可能;是否具有一定的“峰度”以確定是否具有優化的效果;3.找到與這些元素相關程度高的其他可控制參數;4.分析這些相關可控制參數對目標元素影響關系;5.通過改變可控制參數的數值間接調整目標元素的值直至達到期望值。優化是一個在某個方向上的概念。一個研究對象可能可以同時進行多處優化,但是,都需要一個一個方向來解決。

    以某鍋爐項目為例,確定本體排煙溫度為優化目標元素,并有期望值200℃,通過相關系數確定與本體排煙相關程度大的參數為冷凝器出水溫度、冷凝器進水溫度、爐膛溫度、冷凝器出煙溫度,最后利用模式搜索法來調整這四個參數進一步使得本體排煙溫度不斷往期望值靠近。優化方案就是按照這種方式給出。 

    圖10
    圖片名稱
    圖片名稱
    青山沙希