中文題目:高效的兩輪車違法駕駛行為檢測模型
論文題目:Efficient Detection Model of Illegal Driving Behavior in Two-Wheeled Vehicles
錄用期刊/會議:The 2024 Twentieth International Conference on Intelligent Computing (CCF C類會議)
作者列表:
1) 祝留宇 中國石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè) 碩 23
2) 王智廣 中國石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系教師
3) 劉志強(qiáng) 中國石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè) 碩 23
4) 李曉雪 中國石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè) 碩 23
5) 李 珅 中國石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)技術(shù)系 碩23
文章簡介:
隨著現(xiàn)代智能交通系統(tǒng)的快速發(fā)展,兩輪車違法駕駛行為的智能化檢測成為了提升交通管理效率與安全性的關(guān)鍵環(huán)節(jié)。然而,這一領(lǐng)域的研究與實(shí)踐面臨著兩大核心挑戰(zhàn):數(shù)據(jù)集的稀缺性與檢測模型性能的不盡如人意。針對這些挑戰(zhàn),本文開展了一系列創(chuàng)研究工作。
摘要:
兩輪車違法駕駛行為的智能化檢測是構(gòu)建現(xiàn)代智能交通監(jiān)管系統(tǒng)的一個(gè)重要部分。然而,在這個(gè)領(lǐng)域的智能化檢測面臨著兩個(gè)主要問題:第一個(gè)問題是缺乏相關(guān)的開源數(shù)據(jù)集,第二個(gè)問題是當(dāng)前主流的目標(biāo)檢測模型在兩輪車違法駕駛行為檢測任務(wù)上的精度和速度不夠理想。針對以上問題,本文構(gòu)建了一個(gè)兩輪車違法駕駛行為檢測數(shù)據(jù)集(TIDBD dataset),并且提出了適用于兩輪車違法駕駛行為檢測任務(wù)的高效模型YOLOv8_VanillaBlock。
背景與動(dòng)機(jī):
目前,關(guān)于兩輪車違法駕駛行為檢測領(lǐng)域的開源數(shù)據(jù)集極為稀缺,僅有的幾個(gè)開源數(shù)據(jù)集標(biāo)注類別也較為單一,無法推動(dòng)該領(lǐng)域的研究發(fā)展。此外,主流的目標(biāo)檢測模型在兩輪車違法駕駛行為檢測任務(wù)上表現(xiàn)并不理想,需要做進(jìn)一步的改進(jìn)。
主要內(nèi)容:
1、TIDBD 數(shù)據(jù)集構(gòu)建
我們構(gòu)建了專門用于兩輪車違法駕駛行為檢測的數(shù)據(jù)集TIDBD(Two-wheeled vehicle Illegal Driving Behavior Detection)。我們采集數(shù)據(jù)的方式有兩種,第一種方式是使用水平相機(jī)在城市內(nèi)部道路固定路口持續(xù)拍攝。然后對拍攝的視頻進(jìn)行幀提取。第二種方式是在國道、省道以及城市內(nèi)部道路上,利用高架攝像頭進(jìn)行抓拍。我們主要標(biāo)注了使用手機(jī)、正/逆向行駛、非法加裝改裝、是否佩戴頭盔等10種駕駛行為。最終,我們得到了3637張真實(shí)采集且詳細(xì)標(biāo)注的圖片。TIDBD 數(shù)據(jù)集的數(shù)據(jù)分布如表1所示。
表1 不同采集方式和采集地點(diǎn)在TIDBD數(shù)據(jù)集中所占的比例
(1) VanillaBlock
我們借鑒Vanillanet的思想設(shè)計(jì)出了VanillaBlock。圖1展示了我們所設(shè)計(jì)的VanillaBlock的結(jié)構(gòu),其由兩個(gè)卷積層和兩個(gè)池化層組成,中間有一個(gè)激活函數(shù)。VanillaBlock模塊的最后一個(gè)組成部分是由n個(gè)激活函數(shù)組成的序列激活函數(shù)。
圖1 VanillaBlock結(jié)構(gòu)圖示意圖
為了證明我們所提出的VanillaBlock的計(jì)算復(fù)雜度相對于C2f模塊有所減少,我們對C2f模塊和VanillaBlock中各個(gè)組件的計(jì)算復(fù)雜度進(jìn)行了估算,并給出了如下公式。
以YOLOv8l骨干網(wǎng)絡(luò)的最后一個(gè)C2f模塊和YOLOv8_VanillaBlock_l骨干網(wǎng)絡(luò)的最后一個(gè)VanillaBlock為例,
。由于
遠(yuǎn)遠(yuǎn)小于
,故可以忽略不計(jì),則C2f和VanillaBlock的計(jì)算復(fù)雜度之比
。
(2) YOLOv8_VanillaBlock
為了提升YOLOv8在GPU上的檢測速度,我們在VanillaBlock的基礎(chǔ)之上,搭建了一種新的骨干網(wǎng)絡(luò)Yolov8_VanillaBlock,其整體結(jié)構(gòu)圖如圖2所示。
圖2 YOLOv8_VanillaBlock骨干網(wǎng)絡(luò)結(jié)構(gòu)示意圖
實(shí)驗(yàn)結(jié)果及分析:
1、檢測準(zhǔn)確率和FLOPs對比分析
我們在TIDBD數(shù)據(jù)集上使用較大尺寸的YOLOv8l和YOLOv8_VanillaBlock_l模型進(jìn)行實(shí)驗(yàn),以平衡檢測精度和模型大小。以平均精度(AP50)為評價(jià)標(biāo)準(zhǔn)對兩種模型進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明(圖3所示),我們提出的YOLOv8_VanillaBlock_l在“use phone”、“canopy”等檢測類別上顯著優(yōu)于原始的YOLOv8l。
圖3 YOLOv8_VanillaBlock_l與YOLOv8l在TIDBD數(shù)據(jù)集上不同檢測類別AP50的對比
表2 YOLOv8_VanillaBlock與YOLOv8準(zhǔn)確率及計(jì)算量對比
表2顯示,與尺寸為n、s、m、l、x的YOLOv8模型相比,我們提出的具有相應(yīng)尺寸的YOLOv8_VanillaBlock模型的FLOPs分別降低了18.5%、21.8%、30.2%、26.7%和37.5%,mAP50分別提高了1.45%、0.5%、0.18%、1.31%和2.2%。這些結(jié)果表明,我們所提出的YOLOv8_VanillaBlock模型相對于原來的YOLOv8模型在FLOPs有所降低的同時(shí)獲得了更高的準(zhǔn)確率。
2、檢測速度與實(shí)時(shí)性比較
我們測試了當(dāng)輸入圖片分別縮放到320、640以及1088時(shí)的檢測時(shí)間和FPS,檢測時(shí)間測試結(jié)果見圖4,F(xiàn)PS測試結(jié)果見表3。
圖4 不同尺寸的YOLOv8_VanillaBlock與YOLOv8在不同大小的圖片上檢測時(shí)間的對比
表3 YOLOv8_VanillaBlock與YOLOv8在不同尺寸的輸入圖片下的FPS
從圖4可以看出,在相同的輸入圖像尺寸下,YOLOv8_VanillaBlock模型的檢測時(shí)間始終低于相應(yīng)尺寸的原始YOLOv8模型。當(dāng)輸入圖像大小為1088時(shí),檢測速度的提高尤為明顯。從表3可以看出,對于相同大小的輸入圖像,YOLOv8_VanillaBlock模型每秒處理的幀數(shù)始終高于YOLOv8模型。當(dāng)輸入圖像為1088時(shí),YOLOv8_VanillaBlock的FPS分別比對應(yīng)尺寸的YOLOv8高14.2%、3.9%、13.7%、16.1%、30.2%。結(jié)果表明,我們提出的方法可以顯著提高YOLOv8的檢測速度。
結(jié)論:
本文構(gòu)建了專門用于兩輪車違法駕駛行為檢測的數(shù)據(jù)集TIDBD,解決了相關(guān)領(lǐng)域開源數(shù)據(jù)集稀缺的問題。在此基礎(chǔ)上,提出了YOLOv8_VanillaBlock這一專門用于兩輪車違法駕駛行為檢測的模型。實(shí)驗(yàn)結(jié)果證明,我們所提出的模型在檢測精度和檢測速度上都優(yōu)于基線模型。
通訊作者簡介:
王智廣,教授,博士生導(dǎo)師,北京市教學(xué)名師。中國計(jì)算機(jī)學(xué)會(CCF)高級會員,全國高校實(shí)驗(yàn)室工作研究會信息技術(shù)專家指導(dǎo)委員會委員,北京市計(jì)算機(jī)教育研究會常務(wù)理事。長期從事分布式并行計(jì)算、三維可視化、計(jì)算機(jī)視覺、知識圖譜方面的研究工作,主持或承擔(dān)國家重大科技專項(xiàng)子任務(wù)、國家重點(diǎn)研發(fā)計(jì)劃子課題、國家自然科學(xué)基金、北京市教委科研課題、北京市重點(diǎn)實(shí)驗(yàn)室課題、地方政府委托課題以及企業(yè)委托課題20余項(xiàng),在國內(nèi)外重要學(xué)術(shù)會議和期刊上合作發(fā)表學(xué)術(shù)論文70余篇,培養(yǎng)了100余名碩士博士研究生。