回覆列表
  • 1 # 安世辰

    誠邀。

    摘要: “不僅是早期的內容,網際網路的大部分內容都沒有儲存。”

    2005年,還是學生的亞歷克斯·圖(Alex Tew)想出了一個賺100萬美元的點子。

    時年20歲的他正在天馬行空地想怎麼才能支付一個商科學位迫在眉睫的3年學費。亞歷克斯·圖擔心自己的透支金額會迅速增加。於是他在便箋簿上潦草地寫道:“如何成為百萬富翁。”

    20分鐘後,他找到了自認為的答案。

    亞歷克斯·圖建立了一個名為“百萬美元主頁”(Million Dollar Homepage)的網站。該網站的模式極其簡單:上面是100萬畫素的廣告位,以10×10畫素為基本單位銷售,每個畫素售價1美元。你一旦購買,它們就永遠屬於你。售出第100萬個畫素時,亞歷克斯·圖就會成為百萬富翁。至少,計劃是這樣的。

    由於口耳相傳和媒體關注度不斷提高,剛一個月多一點,亞歷克斯·圖的主頁廣告銷售就超過25萬美元(14萬英鎊)。2006年1月,最後1000個畫素在拍賣會上以38100美元(21500英鎊)的價格售出。亞歷克斯·圖真的賺了100萬美元。

    建立近15年後,這個百萬美元主頁還在網上。很多客戶,包括英國《泰晤士報》(The Times)、旅遊服務網站Cheapflights.com、線上入口網站雅虎(Yahoo!)和雙人搖滾組合Tenacious D等在完成了一次性付費後已經打了15年的廣告。該網站每天仍有幾千名訪客,這可能是一筆非常划算的投資。

    現在,百萬美元主頁上的很多連結指向的網站都已不復存在(Credit: Million Dollar Homepage)

    亞歷克斯·圖真的成了百萬富翁。他現在運營著冥想和正念應用程式Calm。但他建立的那個主頁也變成了另一種東西:一個記錄早期網際網路時代的活的博物館。15年看上去可能並不長,但就網際網路而言,就像是一個地質年代。在百萬畫素主頁上,現在大約40%的連結指向的網站已經不復存在,其他連結中很多指向全新的域名,因為原來的URL已賣給了新的所有者。

    大約10年前,我花了兩年的功夫維持一個搖滾音樂部落格和現在屬於美國電話公司Verizon旗下的大型網際網路先驅美國線上(AOL)的音樂頻道。我編輯或撰寫了數百篇現場評論、音樂新聞報道、音樂人採訪和清單體文章。Facebook和Twitter已經吸引了海量使用者,智慧手機連線了我們與工作和家庭之間的網路,上網成了一項不分晝夜的活動。

    你完全有理由認為,如果需要證明花在那上面的時間,我只要用谷歌(Google)搜尋一下就可以了。但你錯了。2013年4月,美國線上突然關閉旗下所有音樂網站,以及數十位編輯和數百位撰稿人共同努力多年的成果。除了網際網路檔案館(Internet Archive)儲存的少量文章外,其餘所剩無幾。網際網路檔案館是一個總部位於舊金山的非盈利基金會,由計算機工程師布魯斯特·卡爾(Brewster Kahle)於上世紀90年代末創辦。

    全球有一系列機構試圖在人類網際網路出現頭十年最後的痕跡完全消失之前挽救出其中的一部分,網際網路檔案館是其中最有名的。

    南安普敦大學網路科學研究所(Web Science Institute at the University of Southampton)常務所長達姆·溫迪·霍爾(Dame Wendy Hall)明白無誤地肯定網際網路檔案館的貢獻。她說,網際網路早期的內容“如果不是這個檔案館,就一點不剩了。如果布魯斯特·卡爾不創辦網際網路檔案並開始儲存,沒有等任何人的許可,我們現在什麼也沒有。”

    達姆·溫迪說,檔案館和國家圖書館有儲存書籍、報紙和期刊的經驗,因為印刷品已經存在很長時間了。但網際網路的誕生,以及它成為大眾交流和表達方式的速度之快,可能讓檔案館和國家圖書館出乎意外。從那之後,在很多領域,對網際網路進行存檔的嘗試一直在盡力追趕。她說:“出版的所有地方報紙,大英圖書館(British Library)都不得不儲存一份。”隨著報紙從紙媒走向網路,存檔工作的形式也發生了變化。這些網站和之前的報紙一樣,是重要的資訊資源嗎?

    報紙存檔也非常重要。報紙停刊或與其他刊物合併時,報紙也容易丟失。她說:“大部分報紙,我想都會有某種分類或存檔。但如果不妥善存檔保管,這些資訊也可能丟失。”

    試圖對網際網路進行存檔有一個主要問題是,它從來都不是靜止不動的。每一分每一秒,網上的照片、部落格文章、影片、新聞報道和評論都會增加。儘管數字儲存的價格已經大幅下降,但對所有這些內容存檔依然要花經費。“誰來出錢?”達姆·溫迪問。“我們產生的東西比過去多得太多了。”

    在英國,數字儲存的工作部分落到了大英圖書館肩上。該圖書館有一個英國網路檔案館(UK Web Archive),從2004年開始獲准收集網站資訊。該檔案館的專案經理韋伯(Jason Webber)說,這個問題比大多數人以為的要大得多。

    他說:“不僅是早期的內容,網際網路的大部分內容都沒有儲存。”

    “網際網路檔案館是從1996年開始儲存各網站的網頁。那時距離第一批網頁建立已經過去了5年。那個曾經從網路複製過來的時代已蕩然無存。”就連1991年建立的全球首個網頁也已經不復存在。人們在全球資訊網聯盟(World Wide Web Consortium)上看到的頁面是一年後製作的副本。

    在網際網路誕生後的最初5年裡,很多時候在英國發布的很多內容都以.ac.uk的指定程式碼域名結尾,表示是學者撰寫的學術文章。直到1996年,隨著商業網站的數量開始超過學術網站數,網際網路上才開始出現更多的綜合性網站。

    大英圖書館每年都會進行一次“網站領域系統搜尋”,以儲存在英國發表的任何資訊。“我們努力把所有內容都存下來,可我們一年只能做一次。但大量網站的儲存量上限被設定為500MB,這可以涵蓋很多小網站,但是你只能存幾個影片,很快就會達到上限。”然而,像BBC新聞這樣的新聞網站確實會獲得較多次數的系統搜尋。韋伯說,大英圖書館嘗試儘可能全面地儲存英國脫歐、2012年倫敦奧運會和一戰100週年紀念等事件的資訊。

    韋伯說:“我覺得我們對一切都會失去的認知非常低。數字世界短暫無常,我們看著手機,其實還沒有思考,手機上的東西就變了。不過現在人們越來越意識到我們可能正在失去很多東西。”

    但韋伯說,像大英圖書館這樣的機構只有權收集可公開瀏覽的內容,數量更大的重要歷史和和文化資料儲存在人們自己的的檔案中,比如硬碟。但我們很少有人把這些留給後代。

    “大英圖書館儲存了大量個人之間的信件。有政客之間的往來信件,也有情書,這些東西對一些人來說真的很重要。”

    檔案館知道儲存報紙的重要性,但對網路內容的出現卻反應遲鈍(Credit: Getty Images)

    即便是搜尋巨頭谷歌的服務也不能倖免。谷歌試圖與Facebook抗衡的社交網路Google+於4月2日關閉。但是否所有使用者都備份了發表在Google+上的照片和記憶?

    韋伯說:“把照片放在Facebook上並不是存檔,因為有一天Facebook也會不復存在。”如果對網路的暫時性有任何懷疑,花幾分鐘瀏覽一下百萬美元主頁。它證明了我們的網路歷史會消失得有多快。

    倫敦大學(University of London)數字人文學科教授溫特斯(Jane Winters)說:“一旦政府換屆或半官方機構重組,網站就會被關閉。或者看看競選網站,其本質上就是臨時性的。”

    有時候,網站消失是伴隨社會的大變革發生的,比如國家本身的誕生和滅亡。她說:“南斯拉夫(Yugoslavia)就是這樣。yu曾是代表南斯拉夫的域名,但南斯拉夫解體後,這種情況隨之結束。一位研究人員正在嘗試恢復南斯拉夫解體前的內容。”

    “政治常常與技術緊密相連。”

    也許有一線希望。“我是研究歷史的,我們一向要克服歷史記錄中的空白,這些空白有些我們知道,有些我們根本不知道。”

    達姆·溫迪·霍爾認為與物質世界也有相似之處。60年代末,15歲的她作為觀眾參與了BBC的音樂節目《流行之巔》(Top of the Pops)的錄製。

    節目在聖誕節那天播出。“電視開著,我母親說‘你在那兒!’但我錯過了。後來我去了BBC,想得到一份複製。他們把它錄下來了。可我從來沒看到過。”

    原標題:早期網際網路歷史存檔內容為何如此之少?

  • 中秋節和大豐收的關聯?
  • 從科學的角度看,星座預言有沒有事實依據呢?