論文題目: Multi-view subspace clustering with consistent and view-specific latent factors and coefficient matrices
發(fā)表會(huì)議: The International Joint Conference on Neural Networks (IJCNN 2021),CCF-C類會(huì)議
作者列表:
1) 盧潤坤 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院 博16
2) 劉建偉 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院
3) 左信 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院
4) 李衛(wèi)民 上海大學(xué) 計(jì)算機(jī)工程與科學(xué)學(xué)院
在多視圖學(xué)習(xí)的研究工作中,子空間聚類是一個(gè)典型的學(xué)習(xí)任務(wù),同時(shí)也是最受研究者關(guān)注的方向之一。大部分多視圖子空間聚類其實(shí)是基于自表示的子空間聚類算法,這類算法認(rèn)為,一系列子空間中的每個(gè)數(shù)據(jù)都能夠被其它數(shù)據(jù)線性表示。大多數(shù)現(xiàn)有的多視圖子空間聚類算法主要關(guān)注兩個(gè)方面的信息,一是子空間表示的先驗(yàn)約束,二是隱表示的構(gòu)造形式。對于前者,對子空間表示引入不同的限制會(huì)得到不同的效果,例如,Brbi?等人在每個(gè)視圖上均進(jìn)行了自表示重構(gòu),并為每個(gè)視圖的自表示系數(shù)矩陣同時(shí)添加了稀疏與低秩限制,之后將所得各個(gè)視圖的系數(shù)矩陣求平均,從而構(gòu)建譜聚類所需的鄰接矩陣;Weng等人也是首先在每個(gè)視圖上均進(jìn)行了自表示重構(gòu),但引入了拉普拉斯正則化項(xiàng)將多個(gè)系數(shù)矩陣整合為了一個(gè)一致性自表示系數(shù)矩陣,這種將整合多個(gè)系數(shù)矩陣的過程嵌入至學(xué)習(xí)流程中的方式更具解釋性。此外,關(guān)于隱表示的構(gòu)造形式,研究者往往嘗試挖掘各個(gè)視圖間潛在的互補(bǔ)性與一致性信息,獲取更加完備且不冗余的隱表示,從而提升學(xué)習(xí)任務(wù)的性能。例如,Chen等人提出的工作可以獲得多個(gè)視圖中的互補(bǔ)性嵌入隱表示;Zheng等人首先將所有視圖的數(shù)據(jù)拼接,并用稀疏誘導(dǎo)范數(shù)約束自表示重構(gòu)項(xiàng)中的噪聲從而可以使模型能夠利用到各個(gè)視圖間潛在的一致性信息。相比于學(xué)習(xí)更完備的隱表示,大多數(shù)工作將注意力集中于子空間表示的先驗(yàn)約束與學(xué)習(xí)過程。然而,基于自表示的子空間聚類算法的表現(xiàn)依賴于數(shù)據(jù)表示的質(zhì)量,多數(shù)子空間聚類算法都假設(shè)數(shù)據(jù)表示分布良好,不符合真實(shí)數(shù)據(jù)集的實(shí)際情況。因此,在子空間自表示學(xué)習(xí)的過程中引入表示學(xué)習(xí)很有意義,其不僅能為子空間聚類提供好的表示,也能利用子空間學(xué)習(xí)任務(wù)更好的挖掘數(shù)據(jù)的潛在信息。
本文基于以上動(dòng)機(jī),提出了一種能夠同時(shí)挖掘并分離多個(gè)視圖中相互耦合的一致性與互補(bǔ)性隱表示的矩陣因式分解方法。其中,一致性表示指所有視圖共享的信息,互補(bǔ)性表示則是各個(gè)視圖獨(dú)有的卻能夠互相彌補(bǔ)其余視圖信息缺失的特有信息。基于此,本章進(jìn)一步提出一種子空間學(xué)習(xí)策略-子空間級(jí)分層策略:基于一致性與視圖特有隱因子與子空間的多視圖子空間聚類(Multi-View Subspace Clustering with Consistent and view-Specific Latent Factors and Subspaces,MVSC-CSLFS)。MVSC-CSLFS為不同視圖的一致性與互補(bǔ)性表示設(shè)計(jì)了不同自表示重構(gòu)方法,即分別用Frobenius范數(shù)與核范數(shù)來約束互補(bǔ)性與一致性隱表示對應(yīng)的子空間表示矩陣,此方法通過為不同性質(zhì)的隱表示設(shè)計(jì)更合適的子空間聚類策略,從而獲取更佳的聚類效果。此外,本章還為提出的方法引入了自適應(yīng)的動(dòng)態(tài)權(quán)重,從而可以在不同學(xué)習(xí)階段衡量各個(gè)視圖對學(xué)習(xí)的貢獻(xiàn),該機(jī)制也可以提升模型抵抗噪聲和不可靠視圖所帶來的影響。最后,本章將采用基于增廣拉格朗日乘子的交替方向最小化算法來求解我們提出的模型,并通過與多種基準(zhǔn)算法在大量的真實(shí)數(shù)據(jù)集中的對比來驗(yàn)證所提出算法的效果。本章研究的主要貢獻(xiàn)如下所示:
(1)通過同時(shí)考慮多個(gè)視圖的一致性與互補(bǔ)性信息,我們提出的隱因子提取算法能夠幫助MVSC-CSLFS獲取更加緊湊且完備的隱表示,且能將隱表示中這些耦合的信息分離,使隱表式有更為明確的語義信息。
(2)MVSC-CSLFS對不同屬性隱式因子對應(yīng)的子空間表示使用不同的先驗(yàn)約束,因此能夠?qū)橄鄳?yīng)的隱表式設(shè)計(jì)符合其語義信息的子空間聚類策略。
(3)為了消除不可靠視圖帶來的影響,同時(shí)在學(xué)習(xí)中能夠衡量不同視圖的貢獻(xiàn),本章在表示學(xué)習(xí)階段和子空間聚類階段均引入了動(dòng)態(tài)權(quán)重策略。
本文提出的矩陣因式化過程如下圖所示:
目標(biāo)函數(shù)為:
1. 收斂性分析
2. 鄰接矩陣可視化
3. 聚類效果
4. 消融分析
劉建偉,副教授,博士生導(dǎo)師/碩士生導(dǎo)師。長期從事模式識(shí)別與智能系統(tǒng)、復(fù)雜系統(tǒng)分析與智能控制、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方面的研究工作。美國數(shù)學(xué)會(huì)《數(shù)學(xué)評(píng)論》評(píng)論員,中國人工智能學(xué)會(huì)機(jī)器學(xué)習(xí)分會(huì)高級(jí)會(huì)員。在計(jì)算機(jī)學(xué)報(bào),自動(dòng)化學(xué)報(bào)、計(jì)算機(jī)研究與發(fā)展、Neurocomputing、TNNLS等期刊上和國內(nèi)國際會(huì)議上發(fā)表學(xué)術(shù)研究論文200多篇,其中三大檢索150多篇。聯(lián)系方式:liujw@cup.edu.cn