澳门银河赌场注册送38-澳门银河赌场招人好招吗_百家乐德州_全讯网下载 (中国)·官方网站

您所在的位置:首頁 - 科學研究 - 科研動態

科研動態

GraphCKSA:基于CENN-KCQ重采樣與雙視角邊優化的雙策略圖神經網絡不平衡節點分類方法

中文題目: GraphCKSA:基于CENN-KCQ重采樣與雙視角邊優化的雙策略圖神經網絡不平衡節點分類方

 

論文題目:GraphCKSA: Innovative dual-strategy GNN for imbalanced node classification with CENN-KCQ resampling and dual-view edge optimization

 

錄用期刊/會議:【Applied Intelligence (中科院大類三區)

原文DOIhttps://doi.org/10.1007/s10489-025-06660-6

原文鏈接:https://link.springer.com/article/10.1007/s10489-025-06660-6

見刊時間:2025年6月18日

作者列表

1) 張麗英 中國石油大學(北京)人工智能學院 公共教學中心教師

2) 陳潞夢 中國石油大學(北京)人工智能學院 計算機技術 碩士 23

3) 鄒天博 中國石油大學(北京)人工智能學院 計算機技術 碩士 23

4) 王智廣 中國石油大學(北京)人工智能學院 計算機科學與技術系教師

5) 鄭馨竺 中國石油大學(北京)經濟管理學院 管理科學與工程系教師

文章簡介:

近年來,復雜的網絡或圖結構在多種場景中廣泛應用,例如交通網絡、引用網絡和社交網絡等。在現實世界中,節點的類別分布往往存在顯著的不平衡性,識別少數類節點對許多應用場景至關重要。本文針對不平衡節點分類問題,提出了GraphCKSA模型,該模型創新性地設計了CENN-KCQ重采樣,解決過度壓縮問題的同時減少多數類節點中的噪聲樣本,并優化了樣本選擇過程有效減少不平衡數據集中多數類的噪聲樣本;結合KMeans聚類和簇內SMOTE過采樣,并通過Q-learning強化學習智能地確定最優聚類簇數K,確保少數類節點的高質量過采樣;通過生成高質量的平衡增強數據集和合理的邊連接,為節點分類器提供了一個平衡增強圖。最終實現了顯著提升不平衡節點分類任務的性能。

摘要:

圖節點類別分布通常存在顯著的不平衡性,使得模型難以有效捕捉少數類節點的特征,導致分類結果偏向于多數類。因此,本文提出了一種全新的圖重采樣框架GraphCKSA,旨在通過 CENN-KCQ 重采樣和雙視角邊優化策略來解決不平衡節點分類問題。GraphCKSA創新性地將CENN欠采樣和KCQ-SMOTE過采樣相結合,構建了高質量的平衡增強數據集,并通過合理的邊連接策略,顯著提升了圖神經網絡在不平衡節點分類任務中的表現。在Cora、Citeseer和PubMed三個公共數據集上的實驗結果表明,GraphCKSA均顯著優于對比模型。此外,通過消融實驗、過采樣規模、不平衡比率和超參數分析,進一步驗證了GraphCKSA的有效性,展現出其在不平衡節點分類任務中的顯著性能提升。

背景與動機:

在現實世界中,節點的類別分布往往存在顯著的不平衡性,即多數類節點的數量遠大于少數類節點。然而,識別少數類節點對許多應用場景至關重要。在處理圖節點分類任務中的不平衡數據集時,直接用原始數據訓練GNN分類器可能難以有效捕捉少數類節點的特征,導致分類結果偏向于多數類,忽視少數類的識別。針對這一問題,本文提出了一種全新的圖重采樣框架GraphCKSA。

設計與實現:

GraphCKSA模型由四個模塊組成:(i)基于GraphSage的特征提取器,用于提取節點的特征表示;(ii)重采樣節點生成器,包括CENN欠采樣和KCQ-SMOTE過采樣兩個部分,用于去除多數類噪聲樣本和生成少數類節點,構建一個高質量的平衡增強數據集;(iii)邊生成器,從局部和全局雙重優化邊連接,形成一個平衡增強圖;(iv)基于GNN的節點分類器,基于平衡增強圖執行節點分類。本文提出的GraphCKSA模型結構如圖1所示。

image.png 

圖1 GraphCKSA模型框架

實驗結果與分析:

為了驗證GraphCKSA模型的有效性,將GraphCKSA與不平衡網絡嵌入方法的代表性方法及最先進的方法(Origin、Over-sampling、Re-weight、SMOTE、Embed-SMOTE、DR-GCN、GraphSMOTE、GraphENS、GraphSR)進行比較。

首先,在三個數據集上比較了GraphCKSA與基線方法在不平衡節點分類任務上的表現。對比實驗結果如下表1。這些結果驗證了GraphCKSA的有效性,顯著提高了圖神經網絡中不平衡節點分類任務的性能。

image.png 

其次,分析了不同模型在不同過采樣規模、不平衡比率下的性能,如下圖2、圖3。通過實驗得到過采樣規模在0.8到1.0之間更有利于不平衡節點分類的性能提升。當不平衡程度更為極端時,GraphCKSA所取得的改進更為顯著。

image.png 

最后,分析了不同超參數的敏感性,如下圖4。由于兩種規模的損失差異,超參數在1 × 10?6和4 × 10?6之間的效果更好。

image.png 

結論:

GraphCKSA通過CENN欠采樣和KCQ-SMOTE過采樣平衡數據集來有效解決欠采樣中過度壓縮及多數類噪聲樣本問題的同時提升過采樣少數類節點的質量,并通過Q-learning算法智能確定最佳聚類簇數K,有效捕捉少數類節點的特征,構建了一個高質量的平衡增強數據集。從雙重視角優化邊連接,形成一個平衡增強圖。實驗驗證了GraphCKSA在不平衡節點分類任務中的有效性和優越性。

作者簡介:

張麗英,講師,博士,中國石油大學(北京)人工智能學院碩士生導師。主要研究方向:機器學習、油氣人工智能及應用、時空數據挖掘。

聯系方式:lyzhang1980@cup.edu.cn


百家乐技巧发布| 什么风水适合做生意| 奔驰百家乐官网可信吗| 百家乐扎金花现金| 真人百家乐官网开户优惠| 百家乐大转轮真人视讯| 澳门百家乐官网什么规则| 大发888怎么进不去| 百家乐官网群shozo| 百家乐官网破解版下载| 全讯网源码| 凯旋门百家乐游戏| 大发888官方网站| 百家乐博彩策略论坛| zaixian百家乐| 云鼎百家乐的玩法技巧和规则 | 大发888娱乐场 zb8| 真人百家乐网西陆| 百家乐官网玩法介绍图片| 百家乐倍投工具| 百家乐境外赌博| 网上百家乐官网骗局| 大发888有手机版本吗| 世嘉百家乐官网的玩法技巧和规则 | 百家乐百博亚洲| 鲨鱼百家乐官网游戏平台| 网上真钱游戏| 百家乐平玩法这样| 百家乐实战路| 百家乐赌假的工具| 百家乐官网真人娱乐注册| 太阳城论坛| qq百家乐官网网络平台| 永康市| 镇康县| 万博88真人娱乐城| 大发888大发888m摩卡游戏博彩官方下载| 澳门百家乐鸿运| 百家乐是否有规律| 大都会百家乐官网的玩法技巧和规则| 利都百家乐官网国际娱乐网|