分類的體系是在整理事物或知識很重要的一環,尤其有龐大的資料時,分類變得更重要(即使因為現在搜尋工具的發展而稍減小了分類的重要性),本文對幾種常見的分類架構加以比較。
        傳統的分類方式就是上層有大類,大類之下再分成小類,一直到分最底層,然後把一件事物放到最小類的位置,要找尋內容時就可以一層一層找下去。像pixnet的部落格就是這樣的分類架構,一般圖書館在放書的時候也是如此分類,這樣的分類的好處是所有事物都有一個固定的位置,也有層層相依清楚明確的結構。


        但這種分類有個缺點就是,如果一件事物同時有兩個以上的不同性質,就可能會顧此失彼,比如我要在圖書館裡要找一本「中國社會史」的書。就會開始疑惑,究竟該到「社會---社會史」還是「歷史---中國歷史」的書架去找這本書呢?結果是只可能放在一個位置,例如,台大圖書館是把這些書放在社會史的分類,但這樣就對於在中國歷史的書架翻閱相關書籍的人來說不方便,可能因此遺漏了可能觸類旁通的機會。
        因為實體的書只有一本,沒辦法放兩個地方,但電腦中的世界則不然,較早接觸到的能夠把一個事物作二種分類的,是bbs的精華區。bbs的精華區雖然事實上也是採上述的傳統分類架構,但因為文章的內容佔的空間不大,所以有需要的時候可以把同一篇文章複製成兩分,同時放在兩個不同的分類裡面,從這兩個分類都可以找得到該文章,這種形式雖然基本架構不變,但對於傳統分類的缺點有所改進。
       為了突破傳統分類方式不自由彈性不佳的缺點,於是在各種網站中出現了tag(標籤)的分類方式,tag其實類似於書籍或論文的關鍵字,一般由產生資料的人來設定,以tag分類的特性是自由度高很高,分類名稱可以自訂且數量不限,因此使用上很方便容易上手,也可以解決一事物多性質的分類,所以目前在網路上成為十分常見的分類方式,尤其在許多web2.0的網站,可以用這個方式,很快地將大家的提供的事物按類串連起來。
        但tag分類還是有缺點在,即因為太過自由,所以會缺乏精確性和層次。在精確性方面,例如一個人在書籤網站把一篇文章加上「部落格」的tag,另一個人在另一篇文章加上「blog」的tag,另一個人加了「網誌」的tag,三篇文章其實是屬於同一類的,但結果放到了三個不同的分類裡面,這樣就不利於查找資料。
        在層次方面,許多分類其實是可能相依層次的關係,缺少層次在資料數量不大的時候是妨的,但在資料多了以後就會產生麻煩。例如中國的百度百科 的條目分類方式就是用tag,好處是大家都能很方便地把自己寫的條目作分類,但麻煩之處是,許多含括範圍很大較籠統的tag(例如歷史、中國歷史)被使用的數量非常龐大,甚至有上萬個條目被加上同一個tag,這樣的結果是想用該tag找相關資料的人,會很難找尋真正想要找的內容。
        最後要介紹的是mediawiki(即維基百科所用的軟體)的分類方式,這種分類方式是介於前兩種分類之間,是我很喜歡的一種分類方式。
        它的基本模式是,一個事物(例如維基百科的條目)可以放到一個或多個分類底下,一個分類也同時可以放到一個或多個母分類底下。但和tag不同的是在放分類時,分類名稱必須要是「正確的」(亦即和已有同分類名稱相同),否則會無法連上分類頁(會顯示為紅字)當然也可以視需要成立新的分類頁面。
        這種分類方式,比起傳統分類較有彈性,例如,維基百科中如果有中國社會史的條目(目前還沒有),就可以同時分在中國社會、社會史、中國歷史三個分類裡面,讓不同需要的人都能找到它。這點好處和tag是類似的。
        相較於tag,mediawiki的分類方式的好處一是精確,即要求同類事物只有同一個名字,其他的同義不同字的分類不能存在(例如,中文維基百科用網誌作分類名,blog、部落格、博客等名字就不用作分類名),或者其他同義分的只能用重定向(類似參見…的功能但目前重定向功能還不夠好,必須以人力維護)的方式存在,這樣就不會讓應該同類的條目分到兩個地方。
        另一個特色是,在mediawiki的分類之下,分類與分類之間有相對的上下層次關係,形成一個多層次的架構。所以可以放在較下層分類的條目,就不放在上層分類,這樣上層大分類條目就不會太多而不利查詢,要查詢時可以順著一層層的分類來查詢。舉個例子,「赤壁之戰」就不用放在歷史或中國歷史的分類只要放在中國戰爭和漢朝就可以了。分類的結構大概可能是這樣(因為目前中文維基百科已經分得更細了,所以細部上和實際不同):

             / ------  中國軍事  ----------

   軍事                                            \
    \                                           \
     /   ---- 軍事史 --- 戰爭------ 中國戰爭
    歷史/                                         /              \
   \_____中國歷史______/                 赤壁之戰
                       \__________ 漢朝______  /

也就是說,同一個條目可以從許多路徑來找到條目。                        
       有優點當然也有缺點,mediawiki的分類沒有像傳統分類那麼清楚明確(結構是網狀比較錯綜複雜),又不像tag那樣自由便利,所以如果資料的數量大參與的人眾多時,,會使得要維護整個分類架構的工作,需要大量的人力,或者參與的人大都要熟悉分類的方式,否則很可能反而亂成一團,變得四不像,所以類似像相簿、影片、書籤這樣的網站,還是不如tag來得方便了。

  
 



arrow
arrow
    全站熱搜

    ffaarr 發表在 痞客邦 留言(0) 人氣()