隨著社交軟件的頻繁使用,大多數用戶都將個人信息填寫在社交軟件系統中,針對于社交軟件中的用戶信息主要定位在收集與處理工作,這是一個由信息采集、數據統計分析、數據綜合等于一體的智能化用戶信息采集系統。在社交軟件中采集用戶信息首先進行加工處理,其次要進行統計分析,最后獲取到對使用者用價值的數據集。該系統是通過B/S設計模式實現的應用系統,并結合SSH和SQL Server 2008為系統的主要架構,對發布到社交軟件中的用戶信息進行采集與信息處理工作,整個系統通過對用戶信息采集的具體分析、詳細設計、系統編程實現及運行測試等方面工作。社交軟件中用戶信息收集管理系統具有簡單操作、數據采集最準確、系統運行穩定等優點。經過系統運行測試分析表明,該系統具有實用價值和現實意義。
《現代信息科技》始終堅持學術第一的標準和科學、創新、前瞻、實用的原則,刊載電子信息科技領域研究的新進展、新技術、新成果,促進學術交流,推動成果轉換,提高該領域研究水平和科技裝備水平,服務我國經濟社會發展。
1概述
用戶信息采集系統出現的比較早,包括完全的信息采集和部分信息采集。例如面向主題的采集(面向主題的爬蟲系統),通常廣義上將都視為信息采集系統,它們的共同點都是基于Web信息采集系統,但是,也可以將其分為下面的不同類別:
1)基于全部Web信息采集。它是最廣泛的信息采集方式,由根節點開始到與之關聯的子節點進行逐層信息采集,將全部的鏈接節點采集完畢為止。
2)面向主題的信息采集。按照約定的采集主題,采集與主題相關的數據,主題描述可以是多種數據文本。
3)增量式的信息采集。針對全部數據采集方式而言,有些Web頁面會經常有更新,而大多數又屬于靜止的頁面,其優點是:只更新部分頁面數據即可,大大地縮短采集時間。增量式采集具有高效的采集效率。
4)個性化的信息采集。信息采集根據用戶的興趣作為采集的方向,滿足不同用戶個陛化需求。
5)分布式的信息采集。通過設置多個采集節點,讓采集系統之間協同信息采集,最后將采集到的數據進行合并操作,其優點是:采集性能良好和采集速度快,分布式采集需要解決一是分布式采集服務,二是采集規則的協調性。
2系統分析
本文實現社交軟件用戶信息收集管理系統總體需求分析包括:系統功能和性能分析。本文采用SQL Server 2008構建系統的數據存儲業務,有效地解決了采集數據存儲難題,通過B/S設計模式作為本系統的架構模式,也減輕了系統維護的工作量并且降低了開發該系統的成本。社交軟件用戶信息收集管理系統的總體功能需求分析包括:1)用戶信息采集管理功能;2)用戶信息加工管理功能;3)用戶信息統計分析功能;4)系統管理功能(角色管理、系統操作日志管理、用戶管理、數據訪問權限管理);5)參數設置功能。
2.1總體需求分析
2.1.1系統技術架構
1)UML建模技術
本文實現社交軟件用戶信息收集管理系統基于UML的設計思想所實現的應用程序,統一建模過程中是按照原型結構進行開發軟件,從多種角度分析用戶信息采集系統的整體特征和功能。
2)SSH框架整合技術
本文通過使用SSH框架整合技術構建社交軟件用戶信息收集管理系統,社交軟件用戶信息收集管理系統整合的目的是為了達到一種快速開發應用程序的效果。Struts框架用于視圖顯示功能,Spring框架實現控制反轉和面向切面的功能,能夠實現表單到字段的對象關系映射是由Hibernate框架提供的,它可以封裝JDBC的數據庫操作接口。
2.2系統的功能需求分析
基于的B/S架構和SSH框架實現的社交軟件用戶信息收集管理系統,由于開發技術非常成熟,該系統實現顯得簡單,通過對社交軟件用戶信息收集管理系統的需求分析,明確劃分系統主要的功能結構。下面為社交軟件用戶信息收集管理系統的功能結構設計,其中包括:1)用戶信息采集管理功能;2)用戶信息加工管理功能;3)用戶信息統計分析功能;4)系統管理功能(角色管理、系統操作日志管理、用戶管理、數據訪問權限管理);5)參數設置功能。
2.3系統主要研究內容
通過社交軟件用戶信息收集管理系統實現工作是本文的主要研究內容:
1)研究社交軟件用戶信息收集管理系統開發所涉及的相關技術,包括:開發平臺介紹、主要的技術架構、主要使用的開發語言、數據庫存儲與電數據分布等技術;
2)研究社交軟件用戶信息收集管理系統總體需求分析與設計,通過UML建模工具構建用戶信息采集系統的原型結構;
3)設計社交軟件用戶信息收集管理系統的技術架構、數據表結構設計等;
4)開發社交軟件用戶信息收集管理系統的功能模塊,主要功能代碼編寫工作、系統功能模塊測試。
2.4非功能性需求分析
1)界面設計需求:要求社交軟件用戶信息收集管理系統按照總體需求設計界面美工,為了能夠使信息采集系統獲得更好的用戶體驗,系統必須有友好的界面。
2)功能擴展要求:系統采取異步功能擴展,對系統升級和維護時采用遠程更新文件的方式。
3系統設計
3.1總體設計
社交軟件用戶信息收集管理系統的總體設計包括:邏輯結構設計、用戶信息采集系統的數據分布設計和系統主要技術架構設計。
1)邏輯結構設計:根據社交軟件用戶信息收集管理系統的需求分析、總體設計和詳細設計要求,根據信息采集的鏈接數、系統承載的壓力進行設計,實現用戶信息管理系統功能。
2)用戶信息采集系統的數據分布設計:數據庫中的數據存儲業務設計是由于數據庫的性能取決是否能夠實現對數據的快速訪問,因此,本文涉及數據分布設計采取水平分布策略,這種分布訪問策略優點利于用戶信息采集節點分布式設計。
3)系統技術架構設計:本文采用B/S模式和SSH整合框架開發社交軟件用戶信息收集管理系統,并結合SQL Server2008作為后臺數據存儲的數據庫。
3.2系統的數據庫設計
根據前文的需求所述,下面介紹社交軟件用戶信息收集管理系統數據表的概念結構設計和該系統所使用的主要數據表名稱及其字段名:
1)參數數據表,字段包括:序號、參數名稱、參數值、優先級、權限、是否有效、備注等字段。
2)用戶采集數原始數據表屬性設計,字段包括:采集序號、采集節點名稱、采集地址、采集時間、采集文檔大小、存儲路徑和其他等字段。
3)用戶信息加工數據表設計,根據用戶信息加工數據表字段包括:序號、采集序號、加工節點名稱、加工文檔大小、加工日期和其他等字段。
4)用戶信息統計分析數據表結構設計,字段包括:序號、統計分析名稱、統計分析時間、統計分析類型、統計分析內容、統計人和備注等字段。
5)用戶信息表結構設計,根據該數據字段包括:用戶序號、用戶名稱、呢稱、年齡、是否審核、身份證號、所在城市、籍貫、學歷、興趣愛好、身高、體重、聯系方式和備注等字段。
6)系統操作日志數據表結構設計,該數據表字段包括:日志序號、操作名稱、操作人、操作日期、操作內容、操作結果、操作完成程度和備注等字段。
7)用戶采集任務數據表結構設計,該數據表字段包括:任務序號、任務名稱、執行時間、下達人、下達日期、任務狀態和其他等字段。
3.3系統的詳細功能設計
社交軟件用戶信息收集管理系統的功能定義:功能是系統要完成的主要任務,可以根據不同的操作功能設計對應不同的操作界面,社交軟件用戶信息收集管理系統在瀏覽器上即可使用,根據實際需求開發系統的功能。社交軟件用戶信息收集管理系統的功能分配是由不同的角色擔當,而且特定的用戶角色才擁有超級管理員分配的功能。圖1系統的功能結構圖。
3.3.1系統參數設置功能
1)初次設置參數:完成首次設置系統參數的操作。
2)初始化系統參數:當系統運行一段時間之后,遇到不可避免的錯誤時,進行初始化系統參數操作,保障用戶信息不會丟失,社交軟件也能正常運行。
3.3.2用戶信息采集系統管理功能
用戶信息采集之前需要設置信息采集任務,采集任務可以根據用戶的不同喜好進行設置采集任務參數,設置初始的采集節點地址。用戶信息采集系統管理功能還包括對用戶的權限設置和對用戶聊天信息優先級的設置。
3.3.3用戶信息采集功能
將每個采集地址下的頁面內容進行下載到數據庫中的原始采集數據表中,我們需要采集用戶的個人信息、聊天信息、好友列表等與用戶有關的信息,存儲在數據庫中,便于社交軟件中其他模塊使用。
3.3.4加工采集信息功能
從原始用戶采集數據表中將其內容進行過濾,分別設計采集規則,過濾掉用戶不想要的內容或者是垃圾信息,將接近用戶想要的采集數據進行整理和歸納,然后存儲到加工信息數據表中。
3.3.5對用戶加工信息進行統計分析功能
實現對用戶信息統計分析功能是為了更好的掌握已經采集到的數據,將其分門別類的存儲到最終的用戶數據表中,統計用戶信息并且分析完成在社交軟件中的用戶數據詳細采集過程。
3.3.6顯示采集結果功能
經過采集管理、信息加工、信息統計分析和信息采集結果顯示完成本文的全部設計要求,該功能為了實現對已經采集到的真實數據進行顯示操作。
4系統實現與測試
4.1應用程序環境配置
4.1.1社交軟件用戶信息收集管理系統的硬件開發環境
1)中央處理器:17雙核;2)內存空間(規格GB):8;3)硬盤空間:520GB;
4.1.2社交軟件用戶信息收集管理系統的軟件開發環境
1)軟件開發平臺:MyEclipse;2)開發語言:JAVA;3)數據庫:SQL Server2008;4)服務器運行類型:Tomcat8.0版本。
4.2測試
4.2.1系統測試目的
一般來說,軟件測試分為七個基本階段,即單元或模塊測試、集成測試、外部功能測試、回歸測試、系統測試、驗收測試和安裝測試。
社交軟件用戶信息收集管理系統完成上述的功能性測試和集成測試,另外,為了完善整個的測試過程,還需要引進其他的測試工具盒測試方法配合進行測試。本文系統的主要測試目標:
1)系統的測試目標:完成功能性測試之后在完成系統的集成測試,無嚴重運行錯誤即可。
2)系統的性能測試:要求系統性能測試要快速響應用戶請求并且完成用戶的請求,達到用戶需求。
4.2.2測試方案
主要測試方案:社交軟件用戶信息收集管理系統能保證其完整的為采集用戶信息提供服務,為了保證應用程序能夠穩定運行。本文涉及的測試內容如下:1)采集參數設置和初始化設置;2)采集任務的設置;3)用戶信息采集無邏輯錯誤;4)用戶信息采集加工功能正常;5)系統界面無功能缺失;6)統計分析數據準確無誤;7)采集結果顯示正常。
4.2.3測試結論及其測試分析
對社交軟件用戶信息收集管理系統軟件測試時,要按照測試計劃進行測試并得出測試結論,表1測試結果及其測試結果分析。
5本文結論
本文實現對社交軟件中的用戶信息收集管理系統的設計與實現工作,因此,并對用戶信息收集管理系統中的各個功能模塊進行單元測試。最后,本論文的總結工作主要包括:
1)完成用戶信息收集管理系統的需求分析、系統設計文檔;
2)完成系統即將改進與完善工作并適當增加系統其他功能;
3)將需求分析與系統實現功能進行比對,測試系統功能的完成比例;
4)實現對用戶信息收集管理系統的整體功能測試和各模塊界面測試工作。
雖然完成用戶信息收集管理系統中的基本功能,但是由于時間緊任務繁重,本文仍然存在的不足之處:需求分析存在遺漏之處,急于系統設計與實現工作,完成后期的設計與實現工作等,這些細節之處還需要進一步研究開發。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >