My List

Saturday, November 03, 2007

Tag Visualization and TagOrbitals

Web2.0當紅,social tagging也是其中一環。在目前許多tagging system,一個source可以以一個以上的關鍵字來當作它的tag,也就是這個source可以從許多不同的面向來替它分類。然而,當我們的source種類很多、或者數量很大時,tag的數目隨之成長,甚至類別可能變得相當繁雜。Tag visualization的議題正是由此誕生的,目的是嘗試找出較為人性化的indexing呈現方式,協助個人化管理與搜尋。

傳統呈現關鍵字或類別的方式是階層式的(hierachical),而web2.0打破這種固定結構化的呈現方式,轉為比較自由的形式。最廣為人知的標籤視覺化有兩種,一種是以graph,或者稱做network的方式,如下圖所示;

另一種是"TagCloud"(標籤雲),Tag Cloud將使用者所標註的tag以特定的方式排序(通常為字母順序),同時每個tag會根據被使用的頻率而有字體大小的差別,如下圖所示。目前許多Social media網站都使用了Tag Cloud,如Technorati, Flickr, del.icio.us。使用Tag Cloud的好處是輕巧簡潔,然而,這種優點卻是犧牲了一些重要的資訊而換得的,也就是它忽略了tag與tag之間隱含的關係。

最近在survey關於tagging的研究時,發現了一種新的tag visualization方式—TagOrbitals。它是IBM ResearchBernard KerrSIGGRAPH 2006 Sketches提出來的。TagOrbitalsTagCloud的呈現概念背道而馳,它犧牲了簡潔輕巧來換取tags之間關係的資訊。TagOrbitals的視覺化呈現如下圖。

由上圖可以很清楚地看到它的結構,是將每個tag放在一個類似原子的中心(也就是原子核的位置),原子核的外面有許多能階軌道(obrits or bands),跟中心tag相關的所有tags會依據和中心tag共同被標註的頻率來分配所在的軌道,共同出現的次數愈高,愈有可能被放在接近中心tag的軌道,如此便可看出那些tag較常被標註在同一群,tag在語意上的階層種類也一目了然。另一方面,被標註的source的title也同時秀在這個原子結構中,如下圖所示,title會被垂直地放在由內而外所屬的標籤旁,因此有哪些sources是被相同tags所標註的也就得知了。

最後,每一個tag都會有自己的原子結構,tag名稱放在原子中心,而各原子tag的名稱大小也根據出現次數多寡來決定,同時所有tags都是由左下角如泡泡般地生長出來的,如下圖所示。



1 comment:

  1. it is interesting but wastes a lot of space ... any better idea?
    This problem confuses me for a long time!

    ReplyDelete