中文題目:基于Dirichlet過程混合模型噪聲標簽抑制
論文題目:Attacking Noisy Labels via Dirichlet Process Mixture Models
錄用期刊/會議:CCC2025 (CAA A類會議)
錄用時間:2025.4.2
作者列表:
1)宋 宇 中國石油大學(北京)人工智能學院 自動化系 教師
2)任正平 中國石油大學(北京)人工智能學院 控制科學與工程 研18級
3)代思怡 中國石油大學(北京)人工智能學院 控制科學與工程 研23級
4)劉建偉 中國石油大學(北京)人工智能學院 自動化系 教師
摘要:
1)針對高斯混合判別分析需要預(yù)先確定混合成分個數(shù)的缺點,提出了基于Dirichlet混合模型的魯棒分類模型。
2)在Dirichlet混合模型中引入翻轉(zhuǎn)概率機制?;谪惾~斯先驗-后驗理論,我們給出了后驗分布的嚴格理論約簡。通過metropolis Hastings采樣算法,我們利用采樣得到的有限均值來計算重積分。
3)在人工合成數(shù)據(jù)集和真實數(shù)據(jù)集上進行了各種實驗,并與多基準算法進行了比較和分析。
背景與動機:
高斯混合判別分析(GMDA)方法在帶有噪聲標簽的合成數(shù)據(jù)集和真實數(shù)據(jù)集上都顯示出有希望的結(jié)果。然而,GMDA需要手動調(diào)整混合物成分的數(shù)量,這是一個關(guān)鍵參數(shù),如果設(shè)置不當,會導(dǎo)致計算復(fù)雜性增加或預(yù)測有效性降低。
主要內(nèi)容:
Dirichlet混合模型為:




圖1 Dirichlet混合模型
結(jié)論:
針對基于高斯混合模型的穩(wěn)健判別分析需要預(yù)先指定混合分量,且混合分量不再隨訓練樣本而變化的問題,提出了一種基于Dirichlet過程的穩(wěn)健分類算法,自適應(yīng)地確定聚類數(shù)目,然后推導(dǎo)出類別標簽、聚類和各種參數(shù)的后驗分布,并利用metropolis Hastings采樣算法推導(dǎo)出聚類采樣,將多重積分替換為有限均值采樣。實驗結(jié)果表明,基于Dirichlet過程的魯棒分類算法能夠自適應(yīng)地調(diào)整聚類數(shù)目,對帶有標簽噪聲的數(shù)據(jù)具有良好的性能。
作者簡介:
劉建偉,教師。