論文題目:成品油管道運(yùn)行多參數(shù)時空模式提取與可視化
錄用期刊/會議:計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報 (CCF A)
作者列表:
1)紀(jì)連恩 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計算機(jī)系教師
2)邢智博 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計算機(jī)科學(xué)與技術(shù) 碩 20
3)吳 昆 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計算機(jī)技術(shù) 碩 21
4)趙 偉 中國石油大學(xué)(北京)機(jī)械與儲運(yùn)工程學(xué)院 油氣儲運(yùn)工程系 博 19
摘要:
成品油管道系統(tǒng)不僅具有典型的時空特點(diǎn),且其運(yùn)行模式需要由多個監(jiān)測參數(shù)綜合表征,現(xiàn)有時空模式分析方法難以揭示多參數(shù)的綜合時空特征,因此提出一種基于多參數(shù)融合的張量分解方法用于成品油管道運(yùn)行多參數(shù)時空模式的提取。該方法通過對多維管道監(jiān)測參數(shù)進(jìn)行信息量及相關(guān)性分析實(shí)現(xiàn)分組融合,然后將融合后的時空數(shù)據(jù)建模為張量并使用張量分解及聚類方法獲取多維時空模式,最后通過對不同模式下原始多參數(shù)變化趨勢的對比分析,進(jìn)一步發(fā)現(xiàn)和解釋運(yùn)行模式的時空規(guī)律。基于此方法設(shè)計了一套可視化系統(tǒng),以支持用戶從不同分析角度對多參數(shù)表征的綜合時空模式進(jìn)行提取及可視化,基于真實(shí)成品油管道數(shù)據(jù)的案例研究表明了該方法的有效性,為復(fù)雜成品油管道數(shù)據(jù)分析提供了一種新的手段和思路。
背景與動機(jī):
成品油管道長時間運(yùn)行產(chǎn)生的歷史數(shù)據(jù)屬于典型的大規(guī)模高維時空數(shù)據(jù), 且具有長周期、大跨度等特點(diǎn); 而對管道運(yùn)行模式的分析則通常需要綜合多個(類)監(jiān)測參數(shù), 對單個參數(shù)的分析結(jié)果往往不具有實(shí)際意義。為此, 有必要從多參數(shù)分析角度對管道歷史數(shù)據(jù)中蘊(yùn)含的時空模式進(jìn)行探索, 以有效支持管道調(diào)度計劃的合理安排及起泵方案等的優(yōu)化。然而, 傳統(tǒng)的時空模式分析方法以建模求解為主, 計算過程復(fù)雜耗時,分析過程也缺乏領(lǐng)域?qū)<业挠行Ы槿? 難以實(shí)現(xiàn)長周期下多參數(shù)綜合表征的復(fù)雜時空模式提取。近年來,交互式可視化與張量分解相結(jié)合的探索方法得到有效應(yīng)用,但此類方法僅支持單參數(shù)時空模式的分析。因此,研究充分利用領(lǐng)域知識靈活、有效地融合多參數(shù)實(shí)現(xiàn)對多維綜合時空模式提取與展示具有重要意義。
設(shè)計與實(shí)現(xiàn):
針對管道運(yùn)行多參數(shù)難以融合分析的問題,本文設(shè)計了基于因子分析法的多參數(shù)分組融合方法對多類參數(shù)根據(jù)分析目標(biāo)進(jìn)行分組融合。具體過程如下:
(1)通過計算參數(shù)信息熵輔助用戶更準(zhǔn)確的評價原始數(shù)據(jù)集中不同參數(shù)的復(fù)雜程度。對于參數(shù)的每個樣本值,根據(jù)其在數(shù)據(jù)集中出現(xiàn)的頻率來計算其信息熵值,如下所示:
信息熵的計算結(jié)果用來評價數(shù)據(jù)集中參數(shù)值的不確定性和復(fù)雜性,信息熵值越大,表明該參數(shù)在樣本集中數(shù)據(jù)取值越不穩(wěn)定,數(shù)值差別較大,存在明顯的動態(tài)變化特征。信息熵的評價方法可以幫助領(lǐng)域人員從數(shù)值變化角度進(jìn)一步識別與評價各個參數(shù)的分析價值。
(2)通過量化一個變量根據(jù)另一個變量數(shù)據(jù)所獲得的信息量來衡量2個隨機(jī)變量之間的相互依賴關(guān)系即互信息,互信息越高,表明兩參數(shù)間的相關(guān)性越強(qiáng),更適合劃分到同一組中進(jìn)行分析。計算公式如下所示:
(3)基于信息熵和互信息的評價將關(guān)聯(lián)性較強(qiáng)且包含特征較多的參數(shù)劃分為同一參數(shù)組,然后通過因子分析法進(jìn)行融合得到可以代表原始參數(shù)的綜合參數(shù)。
接下來針對時空模式提取的問題,本文設(shè)計了一種結(jié)合聚類的連續(xù)秩一張量分解方法用于綜合參數(shù)時空模式的提取,具體過程如圖1所示:
圖1 連續(xù)秩一張量分解示意圖
Step1,張量建模。將綜合參數(shù)的時空數(shù)據(jù)建模為三階張量。其中S(Station)代表多個站場,D(Day)表示天數(shù),T(Time)表示時間段的個數(shù),將每天再分成多個時間段,例如按小時劃分。得到的張量可表示為,其中
代表在站場s處第d天第t時間段綜合參數(shù)的數(shù)值。
Step2,張量分解。本文采用連續(xù)rank-1的CP分解方法,即每次分解用秩為1的張量來擬合原始張量,然后將原始張量與擬合后的張量做差得到剩余張量,對剩余張量再繼續(xù)執(zhí)行秩為1的CP分解,直到達(dá)到迭代次數(shù)或連續(xù)2次分解誤差變化不大即可停止,其中誤差計算如下所示:
本文將第一分解向量組用來表達(dá)原始張量的多維時空模式概覽并對其進(jìn)行可視化,得到綜合參數(shù)在不同維度上的整體變化趨勢。
Step3,模式提取。通過連續(xù)秩1張量分解得到了多組低維向量,這些向量組都不同程度保留了原始三階張量的特征。將每個張量中包含的3個一維向量按不同維度進(jìn)行劃分,得到描述不同維度特征的特征向量組。通過聚類方法對特征向量組進(jìn)行聚類,可以得到綜合參數(shù)在不同維度上更詳細(xì)的時空模式。
本文將以上時空模式提取方法與交互式可視化技術(shù)相結(jié)合,面向成品油管道運(yùn)行多參數(shù)歷史數(shù)據(jù)設(shè)計并實(shí)現(xiàn)了可視分析框架MPVis,如圖2所示。
圖2 MPVis主界面
實(shí)驗結(jié)果及分析:
圖3 管線輸運(yùn)模式分析(左),局部地區(qū)用油模式分析(右)
本文根據(jù)某成品油運(yùn)輸管道歷史運(yùn)行數(shù)據(jù),選取管線輸運(yùn)模式和局部地區(qū)用油模式2個具有實(shí)際意義的角度進(jìn)行了案例分析,如圖3所示。兩個案例的分析結(jié)果驗證了MPVis系統(tǒng)的可用性和有效性。領(lǐng)域?qū)<艺J(rèn)為本文的分析方法及可視化手段能夠在很大程度上降低工作復(fù)雜度,對現(xiàn)階段管道領(lǐng)域基于數(shù)據(jù)驅(qū)動的決策支持來說具有較大指導(dǎo)意義。
表1 算法特征損失對比
另外,本文構(gòu)造了多參數(shù)時空模式提取的基線方法,并利用上述兩個案例數(shù)據(jù)從不同時空維度分別對多參數(shù)特征損失誤差(越小越好)進(jìn)行計算來對比分析本文方法的有效性。實(shí)驗結(jié)果如表1所示,本文方法在各個維度上都有更好的表現(xiàn),也就是說本文基于參數(shù)融合的張量分解方法可以更好地保留多參數(shù)的綜合時空特征,同時提取的結(jié)果更為可信。
結(jié)論:
面向成品油管道歷史運(yùn)行的多參數(shù)數(shù)據(jù),本文提出一種基于多參數(shù)融合的張量分解方法,用于提取歷史數(shù)據(jù)中蘊(yùn)含的時空模式,并從多參數(shù)分組融合、時空模式提取及可視化、原始多參數(shù)對比分析等角度設(shè)計了可視化系統(tǒng)MPVis。該分析方法及分析流程可以進(jìn)一步應(yīng)用到其他更廣泛的工業(yè)過程領(lǐng)域,為多參數(shù)綜合表征的時空模式提取與分析提供了有力支持。
作者簡介:
紀(jì)連恩,博士,副教授,研究生導(dǎo)師。主要研究領(lǐng)域為大數(shù)據(jù)可視化與智能分析、可解釋機(jī)器學(xué)習(xí)及工業(yè)領(lǐng)域應(yīng)用、虛擬現(xiàn)實(shí)與計算機(jī)仿真、計算機(jī)圖形學(xué)和人機(jī)交互技術(shù)等。主持和參與了國家自然科學(xué)基金、國家科技重大專項和重點(diǎn)企業(yè)合作項目多項。現(xiàn)為中國計算機(jī)學(xué)會(CCF)人機(jī)交互專委會委員、中國圖象圖形學(xué)學(xué)會(CSIG)可視分析專委會委員以及虛擬現(xiàn)實(shí)專委會委員。
聯(lián)系方式:jilianen@cup.edu.cn