摘要:針對目前互聯網的全民普及的趨勢以致不法分子利用網絡散布非法信息、導向性虛假廣告等造成部分防備性較弱的網民受其誘導并導致被騙取財產的現象,設計一種基于圖文識別的廣告圖片檢測系統,通過對數字圖像進行處理,對疑似廣告的圖片加以鑒別并標記,使網絡管理員及早地發現廣告圖片,以及時作相應的處理,從源頭上避免部分網民的財產損失。
關鍵詞:網絡;廣告圖片;圖文識別;網民
1 概述
隨著個人計算機和智能移動設備的不斷普及,互聯網逐漸融入每一位國民的生活之中,因此全國網民數量和人們每天的上網時間與日俱增,據有關報告[1]顯示,截至2019年6月,中國的網民已達8.54億,這一數字既顯示了我國的物質生活水平不斷提高,同時也反映了人們對互聯網資源的依賴程度愈加增長。
計算機網絡的普及不斷改變著人們的生活方式,人與人之間的溝通形式越來越多樣化,人們獲取信息的方式也變得越來越繁多[2]。互聯網在人們帶來的便利的同時,也伴隨著一些安全隱患,其中之一就是一些不法分子利用網絡資源的復雜多樣以及一些網民對網絡信息缺乏甄別能力,對網絡虛假信息防備心理較弱,利用網絡散播非法信息以及導向性虛假廣告,使得部分網民信以為真,進而使得網民的財產安全受到威脅[3],因此針對這一問題,設計并實現一套廣告圖片檢測系統顯得至關重要,通過該系統對可能為虛假廣告的圖片自動加以鑒別和標記,有助于管理員盡早地發現,減少了大量的人力物力,從而從一定程度上可以避免網民的財產損失。
2 系統功能需求
基于圖文識別的廣告圖片檢測系統完成對需監管的指定網站進行內容圖片的爬取,內容圖片的自動鑒別標記,以及將該信息傳遞至網絡管理員處,因此該系統分為三個模塊,分別為圖片爬取模塊、廣告圖片識別模塊以及數據處理模塊。
系統總體流程如圖1所示。
首先,系統通過爬蟲程序爬取網絡管理員需要監測的指定鏈接的圖片內容,并將其存入指定目錄下,針對圖庫中的爬取 的圖片,通過廣告識別程序對圖片進行檢測,如果識別該圖片疑似為廣告圖片,便對其進行標記,并通知管理員,否則繼續進行圖像處理。
廣告圖片一般形如“加QQ*******”“辦證139********”“網絡兼職+152********”等,用戶如果在瀏覽網頁時正好有廣告所述需求時,可能就會通過QQ號、手機號聯系對方,進而一步一步落入不法分子的圈套,并可能造成巨大的財產損失,因此,當圖像中包含上述類似內容時,系統將認定其為疑似廣告圖片,并通知管理員。
為此,首先對圖像進行預處理,預處理的過程如圖2所示。
圖片中的文字信息(只要是數字和字母),可能出現在一張圖片中的任何一個位置,針對圖像的大小不一、信息在圖像中的位置坐標的不確定性,在預處理時,要經歷如圖2所示的圖像壓縮、灰度化、灰度拉伸、開運算、二值化、Canny邊緣檢測、多次的形態學操作等才能將圖片中的信息,其中對于圖像的形態學操作(開、閉運算)主要目的是將圖片的中文字信息剝離出來。
對圖像進行預處理之后,便得出字母、數字信息在圖像中大致位置。接著,對該圖像進行前景與背景的分割,即將除有效信息外的其他的圖片中的像素點作置0處理,得到分割后的圖片僅包含有效信息。
然后對有效信息進行二值化處理,生成有效信息的黑白圖像,這里可適當的改變閾值以實現更好地分辨效果。
最后,對有效二值圖像進行信息分割,得到單獨的數字或字母,并對其個數進行計數,由于0Q號一般為8-11位,手機號一般為11位,因此,系統設置閾值為8,當上述計數結果大于該閾值時,系統即判定該圖片為廣告圖片。
當某張圖像被系統檢測為疑似廣告圖片之后,系統對其進行標記,并通知管理員,以便讓管理員進行進一步的判斷,并及時進行處理。
3 系統測試
為了驗證對疑似廣告圖片的處理過程,選取一張如圖3所示的“辦證刻章”的廣告圖片。
其中,圖3(a)為廣告原圖(圖像處理時為原圖,后期作了馬賽克處理),圖3(b)為程序在圖像中標出有效信息的位置,圖3(c)為將有效信息和背景進行分離,圖3(d)為對圖像進行二值化處理。最后,得出計數值為12(左側邊框被誤認為有效信息,產生值為1的誤差),大于閾值,該圖片被認定為疑似廣告圖片。
4 結束語
針對不法分子可能利用網絡傳播虛假廣告或者違法廣告信息,本文設計了一種基于圖文識別的廣告檢測系統,在一定程度上可較為準確地標記出疑似廣告的圖片,以便讓網絡管理員對圖片進行進一步處理;系統下一步的目標是針對違規圖片的不同的類別,設計出更加普適的網絡圖片檢測系統,以便更好地對網絡環境進行監管和進化。
參考文獻:
[1] 2019年上半年我國互聯網發展呈現六大趨勢特點[J].新聞世界,2019(10):15.
[2]馮洪玉.網絡普及背景下的計算機網絡安全問題研究[J].煤炭技術,2013(1):242-244.
[3]蘇雯.大數據時代網絡詐騙犯罪偵查策略探析[J].法制與經濟,2019(9):101-102.
推薦閱讀:計算機科學與探索CSCD
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >
请填写信息,出书/专利/国内外/中英文/全学科期刊推荐与发表指导