分类法过时了吗?【ZZ】
| 分類法過時了嗎? 引用網址: http://www.qiji.cn/baike/contents/122.html 更新日期: 2005年6月09 周四 Posted By ianwest 更多 標簽: YAHOO Sina Google 頁面工具: [前一項] [后一項] { 發表評論 } | ? |
計算機和互聯網的出現意味著新閱讀時代的來臨,如何組織使用數字格式的信息成為巨大的挑戰。在傳統的閱讀時代,我們可以去圖書館按照圖書分類法,查找我們所需要的圖書,就在10幾年前,我們上大學的第一課仍然是如何使用圖書館,如何在一大廳的卡片里迅速地找到自己需要的知識。圖書分類法很多,有所謂中圖法、杜威法等等,如果我們再往前追溯,我們會發現,對事物進行分類,是我們對其進行研究的第一部,我們為什么說林耐是現代生物學的奠基人,就是因為他建立了近代的生物分類系統。
在網絡時代,人們首先對信息的組織也是嘗試建立這樣一個分類系統,YAHOO可以稱的上是這方面的典范,1997年的YAHOO首頁(Link)清楚地給我們展現了它的分類體系。據說這個分類體系是在圖書館學專家的參與下完成的,但網絡信息與圖書館信息不同的是其對象無所不包,凡是人們關心的,都可能會以網頁或網站的形式出現。隨著時間的發展,網絡上的知識呈爆炸式的增長,YAHOO借助人工的方法顯然是無法為億萬互聯網用戶創造的信息進行分類的。因此如果YAHOO仍然希望他們的分類法可以組織所有網絡信息的話,那只是原則上可行,而事實上是不可能完成的。所以YAHOO開始進行頻道化的發展策略是很自然的事情,既然無法為所有信息,那就“專注于”人們需求最多的那部分信息,體育、新聞、拍賣等就成為了“頻道化”的內容。當然按“頻道”組織信息,并且每日更新的典范是SINA(新浪網),從最初的幾個頻道發展到目前的幾十個甚至更多的頻道和專題。
但對于“組織人類有史以來所有知識”這個巨大挑戰面前,不存在所謂“二、八法則”,即我們無法僅建設有限個頻道,就可覆蓋人們所需信息的有限大部分。所以我們可以看到雖然新浪建設的頻道越來越多,但無論投入多大,終歸只能是有限個頻道,仍然無法匹敵億萬互聯網用戶幾乎無窮的信息(知識)需求。
這個敘述,可以用統計語言學中的Zipf法則進行說明,按Zipf法則,語言中最常用單詞的詞頻$f$與其排序$r$成反比:$f = \frac{C}{r}$。
如果我們把$f$看作人們對特定信息需求的頻率,$r$看作人們各種需求的排序。對$f$的求和,對應就是人們對各種信息的總需求,當$r \to \infty $,這個求和是發散的,即如果我們只求和最大頻率的前$N$項,將永遠是個有限大數,和總信息需求相比只能是無窮小。
在這種背景下,Google誕生了,當然類似于Google的搜索技術在上世紀90年代中期就已出現,只不過Google更成功罷了。Google的做法是用計算機程序去索引“所有”網頁信息,但并不去“組織”這些信息,“組織”工作是由用戶使用的時候與Google互動地完成的,即“關鍵字”查詢。在這種模型下,Google不需要作任何頻道,也不需要預先分類,這些工作都是由用戶自己完成的,Google只需要保證“索引庫”盡量完全,排序法則盡量合理。
從2000年之后,Google的成長是非常迅速的,其中一個原因就是Google滿足了人們對“無窮”種類信息的需求,我們可以看一下Google與Sina最近兩年瀏覽量變化的趨勢,可以更為直觀地體會到這種變化。
如果我們進一步考察,目前最新的互聯網應用的話,它們或多或少都具有類似Google搜索的特征,即由用戶借助網絡工具自主地組織內容,進行分類,如WIKI百科,標簽(TAG)等。
那么分類法過時了嗎?其實對信息分類是我們合理利用信息必不可少的一步,從這個角度分類法永遠不會過時。但金字塔式的分類法再也不是信息分類的唯一選擇,而只是方法之一。基于“小世界模型”、“無標度模型”等的新分類法可能更適合于網絡時代的信息分類。
總結
以上是生活随笔為你收集整理的分类法过时了吗?【ZZ】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 梦到自己怀孕了会不会是真的
- 下一篇: 【转贴】想应聘的瞧仔细了:HW分析大全