澳门银河赌场注册送38-澳门银河赌场招人好招吗_百家乐德州_全讯网下载 (中国)·官方网站

科研動(dòng)態(tài)

面向邊緣計(jì)算推薦系統(tǒng)的聯(lián)邦學(xué)習(xí)激勵(lì)機(jī)制設(shè)計(jì)

中文題目:面向邊緣計(jì)算推薦系統(tǒng)的聯(lián)邦學(xué)習(xí)激勵(lì)機(jī)制設(shè)計(jì)

論文題目:Incentive Mechanism Design of Federated Learning for Recommendation Systems in MEC

錄用期刊/會(huì)議:IEEE Transactions on Consumer Electronics (中科院大類2區(qū),JCR Q2)

原文DOI:10.1109/TCE.2023.3342187

原文鏈接:https://ieeexplore.ieee.org/abstract/document/10356897

錄用/見刊時(shí)間:2023-12-13

作者列表

1)黃霽崴 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 教授

2)馬博聞 中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè) 碩21

3)王   名 中國聯(lián)通 工程師

4)Xiaokang Zhou Shiga University Faculty of Data Science Associate Professor

5)Lina Yao CSIRO's Data61 Senior Principal Research Scientist

6)Shoujin Wang University of Technology Sydney Data Science Institute Lecturer

7)齊連永 中國石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 教授

8)陳   瑩 北京信息科技大學(xué) 計(jì)算機(jī)學(xué)院 教授

摘要:

隨著消費(fèi)電子產(chǎn)品和通信技術(shù)的快速發(fā)展,網(wǎng)絡(luò)邊緣的終端用戶產(chǎn)生了大量數(shù)據(jù),現(xiàn)代推薦系統(tǒng)充分利用這些數(shù)據(jù)來訓(xùn)練各種人工智模型。然而,傳統(tǒng)的集中式模型訓(xùn)練必須將所有數(shù)據(jù)傳輸?shù)皆贫朔?wù)器,存在隱私泄露和資源短缺的問題。因此,移動(dòng)邊緣計(jì)算(MEC)與聯(lián)邦學(xué)習(xí)相結(jié)合被認(rèn)為是解決這些問題的一種有前途的模式。智能設(shè)備可以為聯(lián)邦學(xué)習(xí)提供數(shù)據(jù)和計(jì)算資源,并將本地模型參數(shù)傳輸?shù)脚鋫溥吘壏?wù)器的基站,以聚合成一個(gè)全局模型。然而,由于物理資源有限和隱私泄露的風(fēng)險(xiǎn),用戶并不愿意自愿參與聯(lián)邦學(xué)習(xí)。為解決這一問題,本文利用博弈論提出了一種基于兩階段Stackelberg博弈的激勵(lì)機(jī)制,以激勵(lì)用戶為聯(lián)邦學(xué)習(xí)貢獻(xiàn)計(jì)算資源。本文為用戶和基站定義了兩個(gè)效用函數(shù),并提出了效用最大化問題。通過理論分析,得到了用戶的納什均衡策略和效用最大化問題的Stackelberg均衡。此外,本文還提出了一種基于博弈的激勵(lì)機(jī)制算法(GIMA)來實(shí)現(xiàn)Stackelberg均衡。最后,本文提供了仿真結(jié)果來驗(yàn)證GIMA算法的性能。實(shí)驗(yàn)結(jié)果表明,與其他激勵(lì)方法相比,本文提出的算法收斂速度快,能獲得更高的效用值。

背景與動(dòng)機(jī):

在本文中,為了激勵(lì)用戶貢獻(xiàn)更多計(jì)算資源以提高聯(lián)邦學(xué)習(xí)模型的性能,本文利用博弈論將基站和用戶之間的聯(lián)邦學(xué)習(xí)培訓(xùn)建模為一個(gè)兩階段的Stackelberg博弈,其中基站是領(lǐng)導(dǎo)者,用戶是追隨者。配備服務(wù)器的基站發(fā)起聯(lián)邦學(xué)習(xí)任務(wù)并支付費(fèi)用。基站覆蓋范圍內(nèi)的用戶通過貢獻(xiàn)計(jì)算資源和本地?cái)?shù)據(jù)樣本參與聯(lián)邦學(xué)習(xí)。基站和用戶的目標(biāo)是最大化各自的效用。本文從理論上分析了效用最大化問題的Stackelberg均衡的存在性,并提出了一種基于博弈的激勵(lì)機(jī)制算法(GIMA)來解決用戶和基站的效用最大化問題。

主要內(nèi)容:

本文考慮蜂窩網(wǎng)絡(luò)環(huán)境下推薦系統(tǒng)的典型聯(lián)邦學(xué)習(xí)場景,如圖1所示。它由一個(gè)帶有邊緣服務(wù)器的基站和多個(gè)用戶組成。每個(gè)用戶使用本地原始數(shù)據(jù)訓(xùn)練自己的本地推薦模型。然后,只將局部模型的參數(shù)上傳到邊緣服務(wù)器進(jìn)行聚合,即可獲得全局模型。最后,聚合的全局模型被發(fā)送回用戶設(shè)備進(jìn)行推理和下一次迭代訓(xùn)練。



圖1 MEC中推薦系統(tǒng)的聯(lián)邦學(xué)習(xí)系統(tǒng)模型


本文定義了基站和用戶的效用函數(shù),隨后提出兩階段Stackelberg博弈框架來捕獲參與聯(lián)邦學(xué)習(xí)的各方之間的復(fù)雜互動(dòng)。基站需要決定一個(gè)適當(dāng)?shù)募?lì)方式來吸引用戶參與,以獲得高質(zhì)量的模型。用戶需要決定他們的參與程度,以最大化他們的效用。因此,優(yōu)化問題可表示為



隨后證明了納什均衡的存在性以及Stackelberg均衡的存在,并且提出了一種基于博弈的激勵(lì)機(jī)制算法(GIMA)來實(shí)現(xiàn)Stackelberg均衡,算法偽代碼如下所示:



實(shí)驗(yàn)結(jié)果及分析:

從圖2可以看出,基站和用戶存在唯一的Stackelberg均衡策略。為了驗(yàn)證唯一Stackelberg均衡的存在性,在用戶數(shù)量和用戶策略固定的情況下,將支付從0變化到50。基站的效用曲線呈凸形,曲線最高點(diǎn)為Stackelberg均衡的最佳響應(yīng)。本文還驗(yàn)證了用戶間的唯一納什均衡,對(duì)于每個(gè)用戶根據(jù)其他用戶和基站支付的固定策略改變頻率。值得注意的是,每個(gè)用戶的效用曲線都是凸的。在這種情況下,用戶可以通過確定計(jì)算資源的策略來最大化效用。



圖2 納什均衡及Stackelberg均衡


圖3顯示了基站和用戶的效用變化情,展示了不同用戶數(shù)下Random算法、GIMA算法和Fix算法效用。本文提出的的GIMA算法的基站效用是三種算法中最大的。隨著用戶數(shù)量的增加,GIMA算法與其他兩種算法之間的效用差距越來越大。此外,GIMA算法的增長速度比線性增長慢。實(shí)際上,隨著用戶數(shù)量的進(jìn)一步增加,越來越多的用戶參與到聯(lián)邦學(xué)習(xí)訓(xùn)練中,基站可以獲得大量的計(jì)算資源。但是,為了獲得最大的效用,基站所需的計(jì)算資源量會(huì)趨于穩(wěn)定。此外,隨著用戶數(shù)量的增加,用戶的平均效用減少。這是因?yàn)殡S著用戶數(shù)量的增加,參與聯(lián)邦學(xué)習(xí)訓(xùn)練的用戶越來越多,而獎(jiǎng)勵(lì)的增長速度卻持平。因此,用戶的平均效用變小。可以明顯看出,GIMA算法的基站效用是三種算法中最大的,GIMA算法與另外兩種算法的用戶平均效用差距越來越大。



圖3 不同用戶數(shù)量下的基站效用及用戶平均效用

結(jié)論:

本文研究了一種與聯(lián)邦學(xué)習(xí)合作的MEC系統(tǒng),用于基站覆蓋范圍內(nèi)的推薦系統(tǒng)。基站有償發(fā)布聯(lián)邦學(xué)習(xí)任務(wù),用戶通過貢獻(xiàn)計(jì)算資源和本地?cái)?shù)據(jù)競爭獲利。本文為用戶和基站設(shè)計(jì)了兩個(gè)效用函數(shù),還將效用最大化問題表述為兩階段Stackelberg博弈,并從理論上證明了Stackelberg均衡的存在。然后,本文提出了GIMA算法,以在有限的迭代次數(shù)內(nèi)獲得用戶和基站的均衡策略。通過模擬實(shí)驗(yàn)說明,與其他激勵(lì)方法相比,GIMA算法能快速收斂并獲得更高的效用值。在今后的工作中,我們將考慮數(shù)據(jù)新鮮度的影響,鼓勵(lì)用戶提供新鮮數(shù)據(jù),以訓(xùn)練出更精確的模型。我們將進(jìn)一步考慮數(shù)據(jù)樣本不足的問題,并研究聯(lián)邦學(xué)習(xí)的自適應(yīng)激勵(lì)機(jī)制框架。此外,我們還將從經(jīng)濟(jì)學(xué)角度探索各種激勵(lì)機(jī)制設(shè)計(jì)方法,如反向拍賣等。

通訊作者簡介:

黃霽崴,教授,博士生導(dǎo)師,中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院副院長,石油數(shù)據(jù)挖掘北京市重點(diǎn)實(shí)驗(yàn)室主任。入選北京市優(yōu)秀人才、北京市科技新星、北京市國家治理青年人才、昌聚工程青年人才、中國石油大學(xué)(北京)優(yōu)秀青年學(xué)者。本科和博士畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,美國佐治亞理工學(xué)院聯(lián)合培養(yǎng)博士生。研究方向包括:物聯(lián)網(wǎng)、服務(wù)計(jì)算、邊緣智能等。已主持國家自然科學(xué)基金、國家重點(diǎn)研發(fā)計(jì)劃、北京市自然科學(xué)基金等科研項(xiàng)目18項(xiàng);以第一/通訊作者在國內(nèi)外著名期刊和會(huì)議發(fā)表學(xué)術(shù)論文60余篇,其中1篇獲得中國科協(xié)優(yōu)秀論文獎(jiǎng),2篇入選ESI熱點(diǎn)論文,4篇入選ESI高被引論文;出版學(xué)術(shù)專著1部;獲得國家發(fā)明專利6項(xiàng)、軟件著作權(quán)4項(xiàng);獲得中國通信學(xué)會(huì)科學(xué)技術(shù)一等獎(jiǎng)1項(xiàng)、中國產(chǎn)學(xué)研合作創(chuàng)新成果一等獎(jiǎng)1項(xiàng)、廣東省計(jì)算機(jī)學(xué)會(huì)科學(xué)技術(shù)二等獎(jiǎng)1項(xiàng)。擔(dān)任中國計(jì)算機(jī)學(xué)會(huì)(CCF)服務(wù)計(jì)算專委會(huì)委員、秘書,CCF和IEEE高級(jí)會(huì)員,電子學(xué)報(bào)、Chinese Journal of Electronics、Scientific Programming等期刊編委。

大发棋牌游戏| 百家乐官网博娱乐场开户注册| 真钱百家乐游戏大全| 猪猪网百家乐软件| 澳门百家乐有赢钱的吗| 内江市| 巴比伦百家乐官网的玩法技巧和规则| 百家乐园百乐彩| 衢州市| 百家乐棋牌技巧| 新时代娱乐城开户| 好望角百家乐官网的玩法技巧和规则 | 盈丰国际博彩网| 百家乐官网桌子黑色| 大发888官方网址| 百家乐官网在线娱乐可信吗| 广州太阳城巧克力社区| 百家乐官网网上真钱娱乐平台 | 金沙城百家乐大赛规则| 百家乐官网赌场软件| 丽景湾百家乐的玩法技巧和规则 | 百家乐是娱乐场| 百家乐的必胜方法| 百家乐官网赢钱秘密| 百家乐官网群boaicai| 蓝盾百家乐打法| 玩百家乐官网技巧博客| 哪家百家乐从哪而来| 百家乐官网分析概率原件| 888百家乐的玩法技巧和规则| 24山先天分房| 百家乐官网玩法及技巧| 济州岛百家乐的玩法技巧和规则| 大发888存款| 利都百家乐官网国际赌场娱乐网规则 | 百家乐英皇娱乐场| 百家乐21点游戏| 网上百家乐平台下载| 亚洲百家乐官网新全讯网| 棋牌游戏平台排行榜| 网上百家乐返水|