My List

Monday, November 05, 2007

Tagging from System View

再來,整理一些關於目前網路上現有tagging應用的類別。大致上,tagging systems可以依據以下兩類來分析:(1)系統設計上的特色,以及(2)個人使用tag的動機與目的。此二者對於最後所有被annotated的tags可以傳達的意義、資訊如何在使用者間流動與互動、後來使用者tag的意願等都有舉足輕重的影響。這裡主要著重在系統設計上的一些介紹,從使用者的觀點下一篇再寫。

A. Tagging Rights
這或許是影響整個tagging system最大的部份,可再細分為三類:
self tagging: 使用者能夠tag他自己所製造的source,如Technorati
free-for-all tagging: 任何人都可以tag任何source,如Yahoo! Podcasts
permission-based tagging: 系統允許不同層級的tagging權限,如系統指定source給使用者tagging(如ESP Game)、使用者具體指明哪些人能夠做tagging(如Flickr: friends, family, contact distinctions)。相對地,系統也可以決定讓哪些人能刪除已標註的tags:任何人都可以刪除tags(如Odeo),只有創造該tag的人能夠刪除它(如Last.fm),或者只有source的擁有者能夠刪除(如Flickr)。
由此看來,selg tagging明顯是較能夠採集到更廣泛的tags,也就是同樣一個tag所代表的涵義可能會隨著下tag的人的族群或類型而不同。

B. Tagging Support
tagging的機制對整個tagging系統所呈現的行為也有影響很大。大致可分為三類:
blind tagging: 使用者無法看到其他人對相同source下了哪些tags,如del.icio.us
viewable tagging: 針對同一source,使用者看得到已經被下過的tags,如Yahoo! Podcasts, mybloglog。不過,此種tagging方式將可能使特定的source被overweighting。
suggestive tagging: 使用這下tags時,系統會自動建議相關的tags,如Yahoo! MyWeb2.0, del.icio.us
其中suggestive tagging的方式有助於使tagging system趨向於folksonomy,也就是協助整合(或收斂)針對特定source的tags usage。

Folksonomy「群眾分類法」是Thomas Vander Wal所創,由folks與taxonomy所組成,指個人運用自由定義關鍵字的協同分類,其形成通常必須滿足以下幾個特性:

a. 資料量龐大時: 在使用者沒有training任何依據來分類的情況下,下關鍵字或定義必定存在盲點或發生錯誤,但若資料量龐大且具重複性時,相同內容可能被許多不同關鍵字標註,其搜尋結果反而能趨近涵蓋各個面向。

b. 適用非學術/非精確/非嚴謹的領域: 若是特定的專門領域,肯定會存在許多相當嚴謹且精確的術語來對某一概念或事件做描述,但對普羅大眾而言這是難以達到的。

c. 配合indexing使用: 不管用哪一種index方法所做成的系統都得結合關鍵字,以達到關聯分析,譬如某些關鍵字與哪些關鍵字時常同時被標註,如此才能提供使用者較為完整的資訊。

其實社會科學領域早已對"Folk Classifications"(非專業人員如何進行分類),做了相當程度的研究。可以參考Harold Conklin的《Folk Classification: A Topically Arranged Bibliography of Contemporary and Background References Through 1971》(1972, Amazon)。
而且Folksonomy與圖書資訊學中的「分面分類法」(Faceted Classification)是沒有直接關係的。

C. Aggregation
所指的是對同一source,其tags使用的重複性(multiplicity),即是否允許不同使用者下相同的tags。
bag model: 允許不同使用者對特定source下相同的tags,如del.icio.us
set model: 針對同一source,即使是不同使用者下tags,也不允許重複的tags出現,系統會自動將相同的tags識別為單一tags,或要求使用者不能下已標註的tags,如YouTube, Flickr
對於使用bag model的tagging systems,必須要有能力以統計的方式將特定source、不同使用者集體下的tags呈現出來,如del.icio.uspopular link。甚至要進而能夠從這些被不同使用者下的相同tags中找出sources, tags, users間彼此的關係。

D. Type of Source
被tagged的source的類型也是tagging system所必須考量的,而廣泛來說,目前tagged source不外乎webpages(del.icio.us), bibliographic material(CiteULike), blog posts(Technorati, LiveJournal), images(Flickr, ESP Game), users(LiveJournal), Video(YouTube), audio objects such as songs(Last.fm), podcasts(Yahoo! Podcasts, Odeo), physical locations or events(Upcoming).
當然,針對不同類型的sources,被下的tags的用語與意義也就大不相同了,不過因此也衍生出multimodality correlation的研究議題,也就是能否針對同一tags名稱找出不同type的source彼此間的關係,譬如替multimedia analysis提供了許多現成的training data。

E. Source of Material
Source的來源是由誰來提供呢?是普羅users嗎(如Flickr, YouTube, Technorati, Upcoming)?還是系統提供呢(如ESP Game, Last.fm, Yahoo Podcasts)?甚至,來源是整個web的任何東西哩(如del.icio.us, Yahoo! MyWeb2.0)!

F. Resource Connectivity
在tagging system中sources彼此間是否存在隱含的關係呢?答案是肯定的。在此先不談理所當然地由tags建立起的sources的關係。Sources可以由直接的hyperlinks建立關聯(如webpage)、根據系統區分或使用者指定的group來串聯、藉由相同或接近的時間、地點、立場來建立事件的關連(如Upcoming)。這些不同關聯方式的背後隱含的是,相同關連下的sources,他們的tags很有可能類似,甚至相同,尤其在suggestive tagging與viewable的系統中。

G. Social Connectivity
上面講的關連是針對sources,那麼users彼此間的關係又如何呢?在有些提供social network service(SNS)的tagging system中,會根據使用者的興趣、所在地、教育背景、職業等等來協助建立彼此的關連、或以對稱(symmetric, know each other)或非對稱(asymmetric, A know B, B doesn't know A)的方式(如Flickr就未必是symmetric的),讓使用者間有機會形成社群,或者說是localized folksonomies。

後記:挫賽... 明天要MMAI期中考,我竟然還在寫這個 = =+


No comments:

Post a Comment