中文題目:用于信息級聯(lián)預測的深度學習方法
論文題目:CaSTGCN:Deep Learning Method for Information Cascade prediction
錄用期刊/會議:2024中國自動化大會(CAA A類會議)
錄用時間:2024.9.18
作者列表:
1)黃世博 中國石油大學(北京)人工智能學院 控制科學與工程 研23級
2)張 罡 中國石油大學(北京)經(jīng)濟管理學院 信息管理與信息系統(tǒng) 本20級
3)劉浩博 中國石油大學(北京)人工智能學院 人工智能 本21級
4)張晨曦 中國石油大學(北京)經(jīng)濟管理學院 信息管理與信息系統(tǒng) 本21級
5)劉建偉 中國石油大學(北京)人工智能學院 自動化系 教師
摘要:
隨著社交媒體技術(shù)的成熟,一種大量信息不斷傳播和在社交網(wǎng)絡上與用戶互動。在線的傳播信息對個人、組織和社會有重大影響。因此,控制和預測信息級聯(lián)尤為重要。傳統(tǒng)的信息級聯(lián)預測和純序列建模方法難以捕捉時間性和結(jié)構(gòu)性級聯(lián)中的信息以進行準確預測。最近許多研究已經(jīng)開始探索深度學習算法,特別是圖神經(jīng)網(wǎng)絡(GNN)和序列在預測信息中對神經(jīng)網(wǎng)絡算法進行建模。因此,我們提出了一個名為用于信息級聯(lián)預測的深度學習方法(CaSTGCN)提取信息級聯(lián)的結(jié)構(gòu)和時間特征以及預測其未來的增量大小。
背景與動機:
現(xiàn)代社交媒體平臺,如新浪微博、Twitter 和 Facebook 已成為意見分享、信息獲取和在線在世界各地進行社交,因為它們易于使用,并且效率。在這些平臺上,用戶不斷創(chuàng)建新內(nèi)容,可以被其他人轉(zhuǎn)發(fā)和討論users 的微博數(shù)據(jù)的即時性和爆發(fā)性。作為結(jié)果,如何處理和利用這些海量數(shù)據(jù)成為熱門話題,對信息的研究社交媒體中的傳播迅速引起了廣泛關(guān)注。
主要內(nèi)容:
在本文中,受先前研究的啟發(fā),我們構(gòu)建了一種用于級聯(lián)序列預測的 ST-GCN,我們稱之為 CaSTGCN。具體來說,我們使用 ST-GCN 和 TCN,它結(jié)合了結(jié)構(gòu)和時間特征來預測給定級聯(lián)的增長大小。通過定義活動和非活動狀態(tài),我們將級聯(lián)分為多個快照,每個快照都包含底層網(wǎng)絡和每個節(jié)點的活動狀態(tài)。這些快照中節(jié)點的表示是使用專門設計的 ST-GCN。嵌入結(jié)構(gòu)和時間信息的快照序列發(fā)送到 TCN 層以進一步提取時間特征并使用 MLP 層獲得最終預測。
圖4. CaSTCGN 的整體框架
結(jié)論:
總而言之,我們提出了一個帶有編碼器-解碼器信息級聯(lián)圖的預測模型。該模型首先嵌入了使用多個 ST-GCN 的級聯(lián)圖的特征模塊。然后它進一步通過 TCN 模塊提取時間特征,并且然后進行預測。為了測試我們的模型,我們進行了在兩個真實數(shù)據(jù)集和一個合成數(shù)據(jù)集上進行實驗,結(jié)果表明 CaSTGCN 的表現(xiàn)優(yōu)于以前的最先進模型。此外,圖注意力能夠讓 CaSTGCN 捕獲更多動態(tài)信息,收斂速度更快。我們未來的工作重點是在更大規(guī)模的社交網(wǎng)絡。
表1. 預測性能

作者簡介:
劉建偉,教師,學者。發(fā)表學術(shù)研究論文280多篇。