個人檔案出現(xiàn)了新的研究領(lǐng)域就是個人數(shù)字檔案,下面文章首先簡單分析國內(nèi)外個人數(shù)字檔案存檔的基礎(chǔ)情況,針對個人數(shù)字檔案存檔過程中的問題提出了一系列的設(shè)想,包含收集渠道,收集范圍,收集方式以及數(shù)字檔案的相關(guān)鑒定。針對數(shù)字檔案的組織分類方法進(jìn)行相關(guān)指引,對個人數(shù)字檔案的管理從個人和檔案部門分別論述,證明了個人數(shù)字檔案存在的價值,文章最后針對個人數(shù)字檔案存檔過程中的問題提出相應(yīng)對策。
關(guān)鍵詞:個人,數(shù)字檔案,數(shù)字檔案存檔系統(tǒng)
隨著電子產(chǎn)品的大量使用,人們在工作、生活中產(chǎn)生了大量的數(shù)字信息,對數(shù)字檔案的研究個人數(shù)字檔案的收集、組織、管理和利用成了新的研究領(lǐng)域。
1國內(nèi)外個人數(shù)字存檔概況
個人數(shù)字檔案是個人數(shù)字存檔的對象。個人數(shù)字存檔是采用信息技術(shù)手段對個人數(shù)字檔案進(jìn)行收集、組織、管理、利用。國外對個人數(shù)字存檔已有相當(dāng)?shù)难芯俊?001年底,微軟研究院成立了MyLifeBits(我的比特人生)項目,旨在“存儲一生中的所有信息”。該項目包括系統(tǒng)開發(fā)(提供檢索功能)和Gordon Bell個人數(shù)字存檔實驗。
2012年,伊利偌伊大學(xué)圖書館的檔案部門也開發(fā)了一個項目,創(chuàng)建了iKive網(wǎng)站,主要提供了一種集中存檔的方式,可保存桌面文件、社交媒體記錄、電子郵件等文件。Cesar Kuriyama參與了美國的Second Everyday項目,用手機(jī)從30歲開始記錄一天中的一秒生活。這給他的生活帶來了非常積極的影響,讓他更加珍惜生命。CNN曾對其進(jìn)行過專訪,在2012年時,被TED邀請做演講,引起了不小的社會反響。
而國內(nèi)卻沒有相應(yīng)的實踐項目,一部分文章討論了個人數(shù)字檔案云儲存環(huán)境、網(wǎng)頁存檔、電子郵件存檔和個人數(shù)字遺產(chǎn)方面的問題,為個人數(shù)字存檔管理提供了一些建議。
2個人數(shù)字檔案存檔過程
2.1個人數(shù)字檔案的收集
人們在日常工作、學(xué)習(xí)和生活中積累的大量數(shù)字檔案資源往往分散在不同的設(shè)備和載體上,包括各類硬盤、U盤、內(nèi)存卡、電腦等電子產(chǎn)品、可穿戴設(shè)備以及目前較為流行的云盤等。在收集個人數(shù)字資源時,需要仔細(xì)查看以上涉及的數(shù)字設(shè)備,收集個人數(shù)字檔案。收集郵件中的數(shù)字資源時,需較全面地了解自身使用過的郵箱,并逐一查看。社交媒體是個人數(shù)字檔案的重點(diǎn)收集對象,包括微博、微信、空間、論壇等。最后就是即時通信中的重要談話內(nèi)容,如阿里旺旺上跟賣家的談話,微信、QQ中重要聊天記錄等。由于個人數(shù)字檔案形式多樣,內(nèi)容分散,因此還需要注意一些筆記或備忘錄軟件,包括印象筆記、有道筆記等。
在進(jìn)行個人數(shù)字檔案收集時,需要確定收集范圍,可從兩個角度來確定,一是內(nèi)容范圍,即根據(jù)個人數(shù)字檔案存檔需求,查看個人數(shù)字檔案內(nèi)容是否相關(guān),并確定該以怎樣的形式進(jìn)行存檔;二是時間范圍,是指在個人數(shù)字檔案資源信息發(fā)生的時間上,根據(jù)收集的目的和需求確定范圍。
針對不同形式的個人數(shù)字檔案,其收集方式有所區(qū)別,例如對網(wǎng)頁更新頻率太快,需對其內(nèi)容進(jìn)行篩選,決定需要收藏的內(nèi)容。
為確保檔案價值,需對其進(jìn)行鑒定。2010年6月到2011年12月,澳大利亞Sue McKemmish采訪了20個人,詢問他們?nèi)绾喂芾砗捅4嫠麄兊臄?shù)字檔案,以及他們對其有沒有一個長期的計劃。在答案中,有關(guān)保存?zhèn)€人數(shù)字檔案的原因有以下幾點(diǎn):希望對他人有潛在作用,如家族史研究或其他研究;希望自己被家人和朋友記得;極其喜愛某些文件、照片、錄音、視頻或其他數(shù)字的東西;不希望把自己的蹤跡忘在腦后;關(guān)注隱私,保存隱私;私人性質(zhì)的文件,如科研論文、工作總結(jié)等;當(dāng)下對自己的數(shù)字資源感興趣。
根據(jù)這幾點(diǎn),個人數(shù)字檔案的鑒定可根據(jù)以下兩個方面來考慮,一是根據(jù)用戶自身的需求進(jìn)行鑒定。根據(jù)用戶自身喜好,對數(shù)字檔案進(jìn)行甄別和選擇,自行確定其價值;二是根據(jù)家庭或社會的整體利益進(jìn)行鑒定。美國國會圖書館在2013年1月發(fā)布了題為《Update on the Twitter Archive at the Library of Congress》的Twitter存檔白皮書。主要強(qiáng)調(diào)了社交媒體信息歸檔的重要性,為學(xué)者研究人民群眾的某些活動或者習(xí)性提供了有關(guān)社交檔案的樣本數(shù)據(jù),也能夠使未來的學(xué)者們更全面地了解今天。此鑒定原則在一定程度上脫離了個人判斷,而要求收集個人數(shù)字檔案的人員有意識地進(jìn)行選擇。
2.2個人數(shù)字檔案的組織
個人數(shù)字檔案分類的方法有很多,包括按個人數(shù)字檔案產(chǎn)生的時間分類,即按年度或者時期進(jìn)行分類;按個人數(shù)字檔案類型分類,包括照片、音頻、視頻、網(wǎng)站、社交媒體等;按個人數(shù)字檔案內(nèi)容分類,包括個人工作類或?qū)W習(xí)類或娛樂類或生活類數(shù)字檔案。
以上這些分類法都是所謂單式分類法,在實際工作中,單式分類法不能很好地滿足個人保存和查找時的需求。因此采用兩種或兩種以上的分類法,進(jìn)行這樣的存儲或查找可以節(jié)省時間。分類標(biāo)準(zhǔn)不唯一,用戶可根據(jù)個人習(xí)慣進(jìn)行調(diào)整。
對個人數(shù)字檔案只進(jìn)行分類還不夠。個人數(shù)字檔案中占比最多的是照片檔案。它們很難進(jìn)行精確的分類和整理,對于個人用戶來說,想要對它們進(jìn)行比較精確的劃分,則可采用添加元數(shù)據(jù)和標(biāo)簽的形式,如Instagram中的“tag people”功能,可以為每一張照片添加用戶標(biāo)簽,采用“# 用戶名”的格式。Lightroom可以快速地對大量照片進(jìn)行管理和后期處理,同時能為照片添加元數(shù)據(jù),只需在Lightroom中導(dǎo)入想要打開的數(shù)碼照片,在右側(cè)的工具欄中點(diǎn)擊在導(dǎo)入時應(yīng)用下的元數(shù)據(jù),點(diǎn)擊新建預(yù)設(shè),就能為照片添加詳盡的元數(shù)據(jù)了。
分類和標(biāo)引的最終目的是更好地幫助用戶進(jìn)行檢索。因此需要構(gòu)建個人數(shù)字檔案目錄,目錄中各條目所記載的文件或文件夾按統(tǒng)一命名規(guī)則進(jìn)行命名,例如“形成時間+標(biāo)題+類型”。endprint
2.3個人數(shù)字檔案的管理
個人數(shù)字檔案記錄用戶生活,保存用戶記憶,因此對用戶來說是重要的,但是這些數(shù)字檔案本身是脆弱的,需要通過軟件和設(shè)備才能訪問。因此對它們進(jìn)行合理的保存和管理是必要的。
對于個人來說,首先需要有進(jìn)行個人數(shù)字檔案存檔的意識。現(xiàn)在很多用戶在使用如U盤、移動硬盤等存儲工具方面并沒有問題,但卻無法做到時常對數(shù)字檔案進(jìn)行更新,同時,對類似云存儲這樣的存儲介質(zhì)不甚了解。如今微信成了非常流行的社交軟件,根據(jù)CNNIC第39次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告(2017年1月):2016年,79.6%的網(wǎng)民最常使用的APP是微信,如圖1所示。
圖12016年網(wǎng)民最經(jīng)常使用的5個APP
用戶在使用微信等即時通信工具時,經(jīng)常會使用朋友圈或QQ空間記錄自己的生活,通常會以“圖片+文字”的形式出現(xiàn)。這作為數(shù)字檔案會保存在運(yùn)營商的服務(wù)器中。其次,對用戶個人來說,數(shù)字檔案存檔的途徑包括:線上途徑,即使用個人云存儲。用戶只需要記住用戶名與密碼即可,在有網(wǎng)絡(luò)的環(huán)境下,在電腦、平板或智能手機(jī)上就能在云盤中查看、管理自己的數(shù)字檔案;線上線下結(jié)合途徑,線上發(fā)布數(shù)字檔案的同時,在線下的實體存儲設(shè)備中保存一份同樣的,有利于日后該數(shù)字檔案的獲取與使用。
而對于檔案部門來說,如何保存重要的個人數(shù)字檔案也是為研究人類記憶做相應(yīng)的資源儲備。相對比較可行的方案是建立個人數(shù)字檔案網(wǎng)站或系統(tǒng)。國外的個人數(shù)字存檔系統(tǒng)相對完善,目前有三款系統(tǒng):人生流、干草堆和無固定位置的文檔。
人生流(Lifestreams)是一種用于管理個人數(shù)字檔案的新模式和系統(tǒng),采用“時間軸”的方法來管理個人數(shù)字檔案。
干草堆(Haystack)是麻省理工學(xué)院的項目。客戶端是一個研究性個人信息管理程序(PIM),這個程序提供了統(tǒng)一的框架,通過一個單獨(dú)的界面來管理用戶的所有信息。
無固定位置的文檔(Placeless Documents)是由Xerox Palo Alto研究中心的研究團(tuán)隊開發(fā),是一個基于個性化文檔屬性、以用戶為中心的文檔管理系統(tǒng)。
我國檔案部門可以參考以上三個系統(tǒng)來提供相應(yīng)服務(wù),不僅接受用戶上傳的個人數(shù)字檔案,而且提供相應(yīng)的鑒定、分類、檢索服務(wù)。相關(guān)檔案人員可從系統(tǒng)設(shè)計最初就參與進(jìn)去,將檔案管理的理念融入系統(tǒng)中,確保檔案的真實性、完整性、有效性,為檔案的長期存取提供便利。同時,相關(guān)檔案部門在構(gòu)建系統(tǒng)的同時,可開展相關(guān)的個人數(shù)字存檔活動,為系統(tǒng)進(jìn)行前期宣傳。提高用戶的數(shù)字檔案收集、管理意識,強(qiáng)化管理技巧。
2.4個人數(shù)字檔案的利用
馮惠玲教授認(rèn)為可利用數(shù)字檔案資源構(gòu)建一個數(shù)字資源庫,通過豐富的多媒體形式記錄我國悠久燦爛的歷史文化和豐富多彩的社會生活,同時,各地區(qū)、行業(yè)可就本地區(qū)、本行業(yè)構(gòu)建相應(yīng)的子庫。而個人數(shù)字檔案便可充當(dāng)此資源體系的素材,成為中國記憶中的一部分,記錄生活,折射歷史。
由于個人數(shù)字檔案具有真實性,那么人們可以在日常生活中利用它來維護(hù)自己的合法權(quán)益。如工作中通過來往郵件可直接確定責(zé)任人;微信、QQ、阿里旺旺等聊天記錄在具有合法性、真實性和關(guān)聯(lián)性的基礎(chǔ)上可作為證據(jù)提供。
個人數(shù)字檔案記錄的是個人的工作、生活,對于個人來說,最大的效用是作為一份回憶存檔,喚醒自身的檔案意識。同時由于這些檔案帶有真實性和原始性,對于他人來說是一份經(jīng)驗參考,具有良好的引導(dǎo)和教育作用。
另外,已有一定數(shù)量的學(xué)者關(guān)注到隱藏在個人數(shù)字檔案背后的科研價值,且已有學(xué)者對此展開了課題研究,對研究當(dāng)今的文化規(guī)范、交流用語、熱點(diǎn)事件等具有推動作用。
3個人數(shù)字檔案存檔過程存在的問題及對策
3.1缺少對用戶隱私問題的關(guān)注
雖然在個人數(shù)字檔案系統(tǒng)中的文件屬于個人或家庭,但是它畢竟是社會記憶的一部分,從長遠(yuǎn)的角度來說,它必然會面臨向公眾開放的一天。另外,云存儲原本就是一個大資源池,用戶無法知道他們的個人數(shù)字檔案被保存在哪個國家哪個地區(qū)的哪臺服務(wù)器上。
想要解決這樣的問題,需要完善的權(quán)限規(guī)則和必要的技術(shù)措施,如馬賽克技術(shù)、數(shù)字簽名技術(shù)等。一方面國家或有關(guān)行業(yè)應(yīng)在法律或行業(yè)規(guī)范上對用戶隱私進(jìn)行相關(guān)規(guī)定,保護(hù)用戶的合法權(quán)益,另一方面,相應(yīng)的個人數(shù)字檔案存檔系統(tǒng)應(yīng)從技術(shù)上給予用戶保護(hù)自身隱私的權(quán)利。
3.2標(biāo)注工作給用戶帶來麻煩
用戶個人產(chǎn)生的數(shù)字檔案量大,從一定意義上來講,用戶標(biāo)注的質(zhì)量高低直接影響整個系統(tǒng)的使用體驗和檢索質(zhì)量。因此,用戶需要花費(fèi)時間和精力認(rèn)真標(biāo)注。但是相應(yīng)的會給用戶造成系統(tǒng)缺乏人性化、智能化的印象。
這個問題的解決方式有兩種,一是發(fā)展技術(shù),實現(xiàn)內(nèi)容識別與自動標(biāo)引;二是在對用戶隱私進(jìn)行保護(hù)的前提下,發(fā)動大眾進(jìn)行標(biāo)引,即將相應(yīng)的數(shù)字檔案公布在相關(guān)的網(wǎng)站上,通過注冊的網(wǎng)民即可在該網(wǎng)站上進(jìn)行相應(yīng)的內(nèi)容標(biāo)注,而網(wǎng)站可建立一套規(guī)則進(jìn)行補(bǔ)貼。
3.3個人數(shù)字檔案的長期保存
對個人數(shù)字檔案如何以一種有效、經(jīng)濟(jì)、易于存取的形式保存下來,使這些檔案能夠不受任何技術(shù)水平或者時間長短的限制,能夠被永久保存、方便地使用。在這個問題上,首先,需要對個人數(shù)字檔案的保存采取一種合理化的策略,什么樣的檔案需要永久保存,不同類型檔案的保存期限,都需要根據(jù)情況進(jìn)行不同的處理方法。另外,長期保存的技術(shù)越來越成熟,包括信息封裝技術(shù)、安全監(jiān)測技術(shù)、完整性校驗技術(shù)、數(shù)據(jù)功能校驗技術(shù)等。將保存策略和技術(shù)相結(jié)合,個人數(shù)字檔案的長期保存才能實現(xiàn)。
4結(jié)語
本文主要針對個人數(shù)字檔案存檔的過程,包括收集、組織、管理、利用提出了一些設(shè)想。在這過程中,還存在很多問題,需要有針對性的解決方案,這樣才能保障存檔過程的科學(xué)性。隨著數(shù)字化信息的不斷增多,個人數(shù)字檔案存檔會日益凸顯其重要性。如何將個人數(shù)字檔案的價值發(fā)揮到最大,需要個人、檔案館乃至整個社會的共同努力。endprint
參考文獻(xiàn)
[1]周亞鋒.國外個人數(shù)字存檔實踐研究與思考[J].信息資源管理學(xué)報,2016,(02):94100.
[2]Hawkins D T. New horizons in personal archiving: 1 Second Everyday, myKive, and MUSE[A]//Hawkins D T. Personal Archiving: Preserving Our Digital Heritage. New Jersey: Information Today,2013:243257.
[3]National Digital Information Infrastructure And Preservation Program. Perspectives on personal digital archiving[J]. Library of Congress,2013:179.
[4]萬凱莉.美國Twitter存檔項目對我國社交媒體信息歸檔的啟示[J].浙江檔案,2014,(5):811.
[5]單靜.個人數(shù)字檔案管理[D].南京:南京大學(xué),2015.
[6]王方.美國國會圖書館個人數(shù)字典藏的推廣與啟示[J].新世紀(jì)圖書館,2013,(4):9597.
[7]CNNIC,中國互聯(lián)網(wǎng)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計調(diào)查(2017)[R].中國互聯(lián)網(wǎng)絡(luò)信息中心,2016.
[8]Lifestreams[EB/OL].[2015-12-25].http://www.lifestreams.com/.
[9]Huynh D, Karger D R, Quan D, et al. Haystack: A platform for creating, organizing and visualizing semistructured information[C]//Proceedings of the 8th International Conference on Intelligent User Interfaces. ACM, 2003:323.
[10]周亞鋒.國外個人數(shù)字存檔實踐研究與思考[J].信息資源管理學(xué)報,2016,(02):94100.
[11]馮惠玲.檔案記憶觀、資源觀與“中國記憶”數(shù)字資源建設(shè)[J].檔案學(xué)通訊,2012,(03):48.
[12]王海寧,丁家友.對國外個人數(shù)字存檔實踐的思考——以MyLifeBits為例[J].圖書館學(xué)研究,2014,(06):6267.
[13]高旭,趙豪邁.數(shù)字檔案長期保存利用技術(shù)機(jī)制[J].檔案學(xué)通訊,2013,(06):8589.
相關(guān)閱讀:科學(xué)檔案整理簡化的優(yōu)勢及可行性分析
伴隨科學(xué)檔案管理的不斷更新發(fā)展,科學(xué)檔案保管整理逐漸向簡化方向發(fā)展,通過對科學(xué)檔案保管和整理進(jìn)行簡化,這一舉措在一定程度上提升了檔案的查找速度,提升了人們的辦事效率。在目前科學(xué)檔案簡化工作中,主要使用的傳統(tǒng)文書式文檔管理方法對科學(xué)文檔進(jìn)行管理簡化,也為檔案管理人員工作提供了便利,下面文章對此展開研究。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >