全文字數:4008字 閱讀時間:10分鐘
我們在網際網路上瀏覽過的資訊、發表過的動態或言論等都會留下痕跡,而這些痕跡的記憶又往往是藉助於一定的工具或組織實現的,網際網路檔案館就是其中之一。它是儲存網際網路記憶和利用網際網路資訊的重要場所,定期收錄並永久儲存網站上可抓取的資訊,對所有使用者提供免費無差別的訪問。在數字時代,技術的飛速發展給檔案館帶來了新的機遇,而飛速增長的網路資訊同樣也給網際網路檔案館留存數字記憶帶來了巨大挑戰。
一、把握機遇(一)留存時代印記
美國:Cloudflare公司和網際網路檔案館聯手確保網站永遠不會完全離線
時間:2020年9月18日
https://www.zdnet.com/article/cloudflare-and-internet-archive-team-up-to-make-sure-websites-never-fully-go-offline/
背景資訊:Cloudflare是一家美國的跨國科技企業,以向客戶提供網站安全管理、效能最佳化及相關技術支援為主要業務。
Cloudflare公司和網際網路檔案館聯手對更多的公共Web站點進行歸檔,它們表示這將使網頁更加可靠。Cloudflare公司的永遠線上(Always Online)服務網站允許Web基礎設施公司與網際網路檔案館的“時光機”(Wayback Machine)共享主機名和URL,以便自動對網站進行存檔。當網站關閉時,Cloudflare公司可從網際網路檔案館中檢索最新存檔的版本,以便使用者訪問網站的內容。
網際網路檔案館的“時光機”具有強大的基礎架構,可透過不同方法標識URL存檔,因此可以大規模存檔網頁。從網際網路檔案館的資料看,迄今為止,透過“時光機”可以訪問超過4680億個網頁。
永遠線上(Always Online)
墨西哥:“勇敢”加入網際網路檔案館,告別“錯誤404”,並自動載入已關閉網站的舊版本
時間:2020年2月29日
https://www.genbeta.com/navegadores/brave-se-une-a-internet-archive-para-decir-adios-al-error-404-cargar-automaticamente-versiones-antiguas-webs-caidas/amp
JavaScript程式語言創始人、Firefox聯合創始人布倫丹•艾奇(Brendan Eich)基於Chromium(由Google主導開發的網頁瀏覽器)開發了勇敢瀏覽器(Brave)。目前,他計劃與網際網路檔案館合作,藉助網際網路檔案館的時光機(Wayback Machine)工具及其所儲存的網頁快照,在顯示404等錯誤的網站提供舊版本的存檔副本。
勇敢瀏覽器
隨著時間的推移,消失的網頁內容越來越多,使用者在根據會話導航從一個連結跳轉到另一個時往往會陷入“死衚衕”。因此,勇敢瀏覽器和網際網路檔案館希望從1.4版本開始將新功能新增到瀏覽器中,即當用戶發現導航連結不可用時可以選擇檢視時光機工具上託管的網頁副本。
小察評新聞:
快節奏時代,資訊的爆炸式增長和快速更迭讓網際網路的記憶變得短暫,網頁承載的資訊在不知不覺中被淹沒在網路海洋裡,有時甚至隨著網頁或平臺的消失而消失。在此情境下,網際網路檔案館應運而生。它致力於網路資訊的收集、儲存和獲取,能夠長期儲存網際網路上極易消逝的碎片化資訊,從而防止網際網路“失憶”。上述新聞向我們展現了目前網際網路檔案館在網頁資訊儲存和訪問中的重要作用,但同時我們也應看到網際網路記憶的留存是一項持續性、系統性的工程。只有樹立起危機意識,我們才能在網際網路記憶消失之前留存下屬於我們的時代印記。
(二)助力成果獲取
美國:網際網路檔案館上傳1.3TBMySpace丟失的音樂
時間:2019年4月4日
https://www.ghacks.net/2019/04/04/internet-archive-uploads-1-3-terabytes-of-lost-myspace-music/
MySpace在網際網路時代初期曾是網路中最大、最受歡迎的社交網站,它允許使用者將音樂上傳到該網站。但最近該公司遷移了伺服器,2015年之前上傳至該網站的所有歌曲、照片和影片都已無法訪問。此外,MySpace也沒有對這些音影片檔案進行備份,所以這些檔案已無法恢復。
但在網際網路檔案館上,使用者可以找到上傳的部分音影片檔案。它儲存了MySpace使用者上傳的部分音樂檔案,容量約為1.3TB,包括2008至2010年間的49萬首mp3歌曲。如果MySpace使用者在2008年至2010年間上傳的歌曲丟失了,只要能夠記住歌名或歌手,就可以在網際網路檔案館中檢索並播放。
播放介面
美國:網際網路檔案館提供新工具使研究論文免於消失
時間:2020年9月17日
https://www.vice.com/en_us/article/g5p7pj/the-internet-archive-has-a-new-tool-to-save-research-papers-from-vanishing
隨著學術期刊從紙質到數字化的轉變,越來越多的人藉助數字期刊更輕鬆地開展研究。但與此同時,研究成果的儲存卻愈加不穩定。研究表明,自2000年至2019年,近200種開放獲取論文期刊已從網際網路上消失,在不久的將來,還有900種不活躍的期刊也將面臨消失的風險。
公眾查閱論文期刊
2017年以來,網際網路檔案館的檔案管理員一直致力於開放獲取期刊的永久儲存,推出了帶有開放API的可編輯目錄Fatcat,以及這些檔案的新搜尋平臺Internet Archive Scholar。在網際網路檔案館的幫助下,任何人都可以協助儲存和閱讀瀕臨滅絕的科學成果。
小察話新聞:
網際網路檔案館創立之初的宗旨是儲存數字化知識中的文化瑰寶,並向所有使用者提供對這些資源的免費無差別訪問。透過訪問獲取與利用各種型別的創造成果,或是幫助公眾陶冶個人情操,或是幫助學者推動學術研究的開展,但無論是哪一種都可能會面對沒有備份、獲取受限而難以利用的情況。而網際網路檔案館對網路資訊的及時儲存為利用提供了保障,這些創造成果是科學、藝術、文化的果實,凝聚著人類的智慧,不僅需要透過儲存來留存過去,更要透過提供利用來讓它們煥發出新的生命力。
日本:網際網路檔案館提供免費電子書,遭到出版商的訴訟威脅
時間:2020年6月14日
https://jp.techcrunch.com/2020/06/14/2020-06-12-internet-archive-ends-free-e-book-program-following-publisher-suit/
背景資訊:新冠肺炎疫情暴發後,網際網路檔案館建立了包括130萬本電子書在內的開放式“國家緊急圖書館”(National Emergency Library),以滿足在新冠病毒肺炎疫情期間全球獲取閱讀和研究資料的需求。但這一做法卻遭到了四家出版商的聯合起訴,它們認為網際網路檔案館有目的地收集版權書籍,並掃描、複製和傳播數字盜版。
由於新冠疫情導致公共圖書館關閉,因此網際網路檔案館建立了國家緊急圖書館,截至2020年6月初,它允許一本書的單個副本被無限次下載。
但出版商認為網際網路檔案館的行為遠遠超出了合法的圖書館服務,踐踏了著作權法,並故意構成了產業規模的數字著作權侵害。2020年6月上旬,四家出版商聯合起來對網際網路檔案館提起訴訟。迫於壓力,網際網路檔案館宣佈該圖書館將提前關閉。
時間:2020年7月29日
https://www.publishersweekly.com/pw/by-topic/digital/copyright/article/83971-internet-archive-answers-publishers-copyright-lawsuit.html
網際網路檔案館創始人布魯斯特·卡利
7月22日,網際網路檔案館創始人布魯斯特·卡利(Brewster Kahle)就曾希望出版商撤銷訴訟,避免訴諸法庭,他認為“即使在數字時代,圖書館也有購買、儲存和出借書籍的權利。”但美國出版商協會(Association of American Publishers)駁回了卡利的提議,認為網際網路檔案館的侵權行為涉及廣泛、證據充足,故現已提交法庭審理。
美國:開放訪問面臨許多問題,這正是網際網路檔案館正在幫助解決的問題
時間:2020年10月5日
https://www.techdirt.com/articles/20201002/06362445431/open-access-faces-many-problems-heres-one-that-indispensable-internet-archive-is-helping-to-solve.shtml
開放訪問的好處不言而喻,但仍面臨許多問題。這主要是因為學術出版商熱衷於控制向開放獲取的任何過渡,並致力於無論何種出版模式都要保持極高的利潤率。但具有諷刺意味的是,開放訪問的最大優勢就在於——任何人都可以在任何時間免費獲取期刊。
近期,網際網路檔案館網站上的一篇文章提供統計資料顯示,至少有240萬篇開放獲取的文章面臨從網路上消失的風險。網際網路檔案館的副本將確保這種情況不會發生。而當這些資料的原件丟失後,只剩下被儲存的副本時,那麼這就是另一個從經濟角度上支援這一免費資源的理由,並能幫助保護它免受出版商的攻擊。
小察話新聞:
數字時代,線上共享的圖書資源極大地方便了人們的生活,卻也出現了核定作者權益、作品版權歸屬等問題。網際網路檔案館與出版商之間的糾紛,再次證明了版權問題的重要性。網際網路檔案館關閉國家緊急圖書館在一定程度上折射出了數字資源在當今網路社會的矛盾處境,如何在保護數字資源著作權的同時方便公眾對數字資源的獲取還需長久努力。無論是網際網路檔案館,還是其他檔案機構,在順應時代推進資源利用方式變革的同時,也應充分認識到其中潛在的風險,並採取措施加以規避。
(二)核查虛假資訊
美國:網際網路檔案館如何與虛假資訊作戰
時間:2019年9月17日
https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
在虛假和極端化內容被迅速建立和傳播、社交媒體頁面不斷更新的時代,擁有一個關於誰在何時說了什麼的不可更改的記錄愈發重要。2016年美國大選以來,網際網路檔案館逐步加大對虛假資訊的打擊力度。
網際網路檔案館創始人布魯斯特•卡利表示,網際網路檔案館正試圖建立一種問責機制,來改善糟糕的現狀。迄今為止,網際網路檔案館已收錄3300億頁網頁、2000萬冊圖書和文字、850萬段音訊和影片記錄、300萬幅影象和20萬個軟體程式。而檔案館會優先考慮收藏那些最受歡迎的公共網站和常被連結的網站。
美國:網際網路檔案館推出對已存檔網頁的事實核查註釋
時間:2020年11月3日
https://mashable.com/article/internet-archive-wayback-machine-fact-check-labels/
網際網路檔案館將透過時光機在某些已存檔網頁上推出事實核查註釋。
網際網路檔案館試圖儲存數字歷史,但也意識到提供虛假和誤導性資訊所帶來的問題,因此希望透過提供便利的上下文資訊連結,幫助使用者更好地理解在時光機上所讀到的內容。
經過事實核查的存檔頁面
小察評新聞:
網路環境的複雜性給資訊的真實性帶來了極大挑戰。不少虛假資訊和錯誤內容經由網際網路大肆傳播,對社會造成了許多負面的影響。就個人而言,網路時代,我們紛紛轉向螢幕,透過螢幕獲取日常生活中的大量資訊,但卻難以核實這些資訊是否真實可信。而網際網路檔案館及其所採取的資訊核查措施無疑是為確保資訊真實性而探索出的一條有益途徑。
小聞小察來總結資訊的爆炸式增長,讓網際網路承載的記憶面臨著迅速被遺忘的風險,而數字技術的不斷迭代演進,更讓儲存網際網路的資訊面臨著巨大的挑戰。網際網路記憶因資訊的易逝性而變得短暫,這既為網際網路檔案館帶來極大的挑戰,也提供了廣闊的舞臺。
網際網路檔案館作為非營利性的線上數字檔案館,存檔了大量網頁、文字、音訊、影片、軟體等,保障了社會公眾永久訪問數字歷史資訊的權利,是網際網路時代的忠實記錄者。它及時留存網際網路上的重要資訊,藉由“時光機”,我們可以感受時代的變遷、品味藝術的魅力。
無論是個人的點滴回憶,亦或是人類的共同記憶,網際網路檔案館都在努力儲存。但要想實現這一願景,網際網路檔案館需要克服各種各樣的困難與挑戰。為了應對隱私、版權、資訊真實性和安全性等問題,網際網路檔案館不僅需要在實踐中投入技術、人力、資金等,更要從宏觀層面著手,從源頭解決問題,確保資源的儲存和共享在合法合規的程式下進行。
網際網路檔案館是儲存網路記憶、留存共同記憶的有益實踐。在資訊化時代,檔案作為記憶的載體與工具,應發揮出自身的獨特作用,這意味著檔案部門應積極參與社會記憶的構建,把握機遇、應對挑戰,推進檔案管理與利用方式變革。
文字 I 洪秋雙 雒方瑩
排版 I 雒方瑩 洪秋雙