關於部落格
  • 1919

    累積人氣

  • 0

    今日人氣

    0

    追蹤人氣

資訊盡在指尖? 網路時代的資訊搜尋與運用

 

中國時報   / 趙學信

在本雅明所謂的「機械複製時代」之前,生物學家、礦物學家也得具備相當的素描能力,才能完成知識傳遞的使命;即使到了20世紀下半葉,教學工具已經進步到幻燈片,但研究方法仍是靠博聞強記。於是不免讓人揣想,如果當年的學者也能享有今天這種「電腦一開,資訊盡在指尖」的研究資源,他們能不能創造出更傑出的成就? 其實不必回想五十年或一百年前,只要回退到十年前網路尚未普及的日子,就會讓人覺得當時落後得不可思議。而即使是網路年代,也可以根據Google的出現,分成兩個時期。今天,不管是學者或文字工作者,一旦沒有Google,資料研究似乎便無從做起。網際網路的發展,的確對資訊的取得造成了顛覆性的變革。 搜尋引擎,篩撿資訊的工具 網際網路其實早在1960年代即已出現,但直到全球資訊網發明後,才真正普及起來。隨著網站逐日大量增加,人們開始需要輔助工具來掌握資訊。最初應運而生的是Yahoo之類的分類目錄,把網站以圖書分類的方式分門別類排列出來,然後是搜尋引擎,如 Lycos、AltaV ista(這兩類網站後來有了更響亮的名稱:「入口網站」),可以直接檢索網頁的文字內容。 然而技術的進步卻仍追趕不上網路的擴增速度,一方面,愈來愈多的網站來不及被編入目錄或索引,另一方面,搜尋的效率低落,往往一找就是成千上萬筆資料,絕大多數毫不相關,查資料變成耗時而收效甚微的工作。 因為單純的邏輯檢索不敷使用,所以得有更聰明的檢索方法。Exc ite是其中的先驅,它在1995年剛推出時,號稱可搜尋130萬篇網頁。不過,當時我以奧地利藝術史家Alois Riegl來試驗,它忽略掉Rieg l這個字、判斷Alois是拼錯字,最後吐出來一堆蘆薈(aloe)的護膚資訊給我,實在難以讓人覺得它比老方法更聰明。而現在,在Googl e上搜尋Alois Riegl,可以從33億篇網頁中找到一千多筆,即使只查英文網頁,也可找到771筆。這除了呈現網路在這八年來的巨幅成長,也顯示Google判斷相關性的能力更為高強。 智慧型搜尋,準確又快速 Google利用一種稱為PageRank的技術,替網頁加上權值。就像學術論文依照被引用的次數和所發表的期刊來決定其重要性,PageRank依照網頁被連結的次數和所在網站的評價來決定網頁的相關性。雖然各家研發「智慧型」搜尋的公司都是採用類似的策略,但Google的方法出奇有效,既準確又快速,往往只要非常簡單的幾個關鍵字,就可以找到想要的資訊。 試舉一例,介紹牛津英文字典編纂經過的The Professor and the Madman,中譯本《瘋子‧教授‧大字典》頗奇特地未附任何專有名詞的原文。書中提到第一本單一語文的英文字典是由勞勃‧考德雷在1 604年所編的。考德雷是誰?他的字典甚麼模樣? 沒有書名和人名的原文,問題似乎難以解答。但在Google裡用“e arliest dictionary 1604” 或 “earliest dictionary robert” 查詢,立刻查得「考德雷」的原文是Robert Cawdrey,書名是A Tab le Alphabeticall of Hard Usual English Words。再改用完整的人名和書名查詢,可以找到更詳細的資訊,甚至查到這本老書的全文。整個過程不到一分鐘。 知識才是檢索資訊的基礎 然而,並不是所有搜尋過程都可以這麼順利。搜尋的難易程度,得視題材冷僻與否、原始線索是否明確而定。有時實際的查詢過程得要經過許多歧路,並不像上述說明所呈現的那麼簡單。你得先具備一些基本的專業知識,而這些知識恐怕很難急救章地靠閱讀網頁來惡補,仍需平時讀書來打底。 這個現象的關鍵在於,我們所享受到網路上的豐富資料量,是犧牲內容的嚴謹度與正確性所換得的。你可以有更廣泛、更多樣的選擇,但是也得自行負擔篩選和判斷的工作。值得注意的是,它所代表的意義並不僅是你得多花力氣,像吃自助餐那樣自己動手,它提供的更像是未經處理、更遑論烹調的材料。 光憑大量網頁的無序堆積,並不能構成知識。就像法國數學家龐卡瑞(Henri Poincare)說的:「科學即事實。科學是由事實構成的,就如同房屋是由石頭築成的。但就像一堆石頭並不等於房屋,一堆事實的集合也未必就是科學。」清晰的結構和有條理的組織並不只是呈現時的表達技巧,而是知識本身不可或缺的一環。 根據科學家的研究,在1999年整個Internet的8億個網頁之中,任意兩篇之間頂多只距離19個連結。換句話說,只要任選一篇為起點,所有網頁都可以在按19次連結之內到達。另一份研究則根據1997年的資料指出,任意兩個網站間的平均距離是4.2個連結。如此高度的連結性,很容易帶給我們知識探索的路徑非常短的錯覺,以為答案就近在咫尺。當你找到答案之後再往回追溯,確實應該會有一條非常短的最佳途徑,但這並不表示當你從一切未知的狀態出發時,也會同等輕鬆。 你要的資訊,可能在電腦外 再回到一開始的問題:如果在「機械複製」之前的時代也有網路可用,結果會如何?學者們原本處理的往往就是未經整理的原始資料,都有足夠的洞見來判別良寙,這是與我們不同的。資料的整理與查詢比以前方便太多,這確實可以大幅節省他們的時間。但對於最重要的目的──從事實中得到新的洞見──我想,資料的累積並不能讓人變得睿智,Google提供的33億篇網頁恐怕幫助不大,反倒可能增加消化資料的負擔。 從以上的探討,我們既可體會網路的莫大效用,但也看見了一些容易落入的誤解。唯有持平衡量它的利弊,才能妥善利用這項工具。有次,我曾在網上研讀了數週關於天主教早期「曠野教父」的資料,當我把資料找遍、仍有問題未解後,才抽空去書店找找是否有書籍可供參考。出乎意料地,熱心的店員當場就解答了我的幾個問題,也推薦了一些書。我驚訝(也驚喜)地發現,其中一本《曠野之聲》,正是我需要的The Sayings of the Desert Fathers的中文選譯本。不免感歎如果早幾天走這一趟,不知可節省多少上網查資料的時間。 所以,別忘了網路之外還有廣大的世界,除了緊盯電腦螢幕之外,也去翻翻書、找人交談。只有平衡、多方向的蒐獵,才能得到最豐碩的收穫。

資料來源 摘自:全球華文行銷知識庫

資料來源 :1758網誌

相簿設定
標籤設定
相簿狀態