事實查核的過程中需要引用大量資料,例如我們的查核報告最下方的「資料來源」部分通常有數十項,當中有不少連結。

由於網頁——特別是刊載失實訊息的網頁——可能會刪除或修改內容,備份網頁這道工序就變得不可或缺。今次我們介紹一下備份網頁的工貝,以及如何使用這些工具協助查核。

以下三個為常見的網頁備份網站︰

  1. Wayback Machine
  2. archive.today
  3. Perma.cc

Wayback Machine

第一個是由互聯網檔案館(Internet Archive)設立的「網絡時光機」(Wayback Machine),網址為web.archive.org。根據《Wired》的報導,Wayback Machine在2001年正式公開,當時已有5年歷史並記錄了100億個網頁,而現在更有多達7,290億個備份網頁。

Wayback Machine使用「爬蟲」(crawlers)自動下載網頁資料,不需要人手處理,因此記錄了大量網頁,一些流量較高的網站往往會有不少備份。

營運Wayback Machine的互聯網檔案館為非牟利組織,其經費來自大眾捐款。公眾可免費使用Wayback Machine備份網頁,我們的查核報告通常也使用它。

archive.today

我們通常會使用Wayback Machine備份網頁,但當出現技術問題無法備份時,我們便會改用archive.today備份。

archive.today有兩個網址,分別是「archive.is」及「archive.ph」,介面較為簡單,在主頁上方可貼上連結備份網頁,下方則可輸入連結搜尋備份記錄。

不過archive.today的常見問答頁面提到,這網站並沒有使用爬蟲程式自動備份網頁,僅依靠用戶手動備份,因此archive.today的記錄較少。

跟Wayback Machine一樣,archive.today同樣為免費服務及接受捐款。

Perma.cc

Perma.cc由哈佛法學院圖書館開發及營運,主要供法律及學術引用網頁時保留永久記錄。學術機構或法院均可免費註冊使用,而其他機構及個人則只能付費使用。

跟上述兩項免費服務相比,Perma.cc在備份社交媒體網頁時較少遇上阻礙,但由於使用人數較少,亦沒有自動備份網頁,因為記錄同樣較少。

雖然Factcheck Lab未有使用Perma.cc的服務,但大家閱讀其他事實查核機構的報告時也有機會遇到,例如浸大事實查核《法新社》(AFP)的報告均有引用Perma.cc的備份網頁。

備份網站的功能

由於我們最常使用Wayback Machine,以下簡單介紹其網站如何使用。簡單來說,備份網站有兩項重要功能︰

  1. 記錄需要引用或查核的資料,以免日後遭修改;
  2. 翻查網頁過去的版本。

Wayback Machine的首頁如下︰

上方正中間的位置(上圖紅框)可輸入網址。如果Wayback Machine曾記錄過這個網頁,會出現以下這個畫面,顯示網站在不同日子的備份網頁(圖中正是Wayback Machine首頁的備份)︰

透過Wayback Machine,我們可以看到網頁在不同時間的變化,甚至可以為網頁「考古」,例如2001年11月——超過20年前——Wayback Machine的首頁如下︰

在該欄亦不一定要輸入完整網址,我們可以輸入關鍵字,搜尋網址或網站介紹含有該字的網頁,又或使用星號(*)省略網址最後一部分字元,例如搜尋「www.factchecklab.org/2022*」,可以找到Factcheck Lab於2022年的查核報告備份網頁(因為我們的查核報告網址使用發佈日期區分)︰

由於不少網頁——特別是新聞報導——會不斷修改但未有註明,這些備份能夠協助我們在查核,例如在最近我們便透過Wayback Machine記錄分別對比了《大公報》《霍士新聞》(Fox News)兩篇報導的變化。

另外,Wayback Machine首頁亦設有「Collection Search」,其中對香港讀者而言比較重要的相信是可以從香港《蘋果日報》及《立場新聞》的備份網頁中搜尋內容,只需要輸入關鍵字後從下拉式清單選擇「hk.appledaily.com」或「thestandnews.com」便可。

多備份保存記錄

而在首頁右下方的「Save Page Now」輸入網址再按「Save Page」,就能夠利用Wayback Machine備份特定頁面。

Internet Archive為Wayback Machine推出手機應用程式(Android / iOS)及瀏覽器擴充套件(Firefox / Chrome / Safari / Edge),安裝後可以迅速備份網頁查看其備份記錄

這些備份工具對事實查核的工作而言非常方便,大家亦可多作備份,保存重要記錄頁。

最後,通常社交媒體網頁及影片網站較難備份,這些時候我們只能夠夠透過截圖或下載影片留下記錄。雖然截圖可以偽造,但在技術限制下,目前我們採用的辦法是公開截圖同時提供連結,供讀者查閱。


  • 本「查核手記」乃「文化及媒體教育基金有限公司」及「媒體素養研究中心有限公司」的合作項目。
  • 本文採用共享創意的「姓名標示-禁止改作」(Creative Commons Attribution-NoDerivatives)授權條款,轉載時須註明「本文出自事實查核實驗室(Factchcek Lab)」,並附上原文網址。

(原載於 Factcheck Lab Patreon。)

訂閱Patreon支持Factcheck Lab運作