My List

Friday, November 30, 2007

ACM Multimedia 2007

ACM Multimedia 2007 was held at 24-29, Sept., Augsburg, Bavaria, Germany. There is the photo slideshow of the scenery for Germany, Switzerland, Austria, and the conference.

ACM Multimedia 2008 will be held in Vancouver, Canada. :p



Elastic Tag Maps

Tag cloud是最常用來表示一個resource來源的tags出現頻率,但它並不能呈現該resource所隱含的terms的結構,也就是它忽略了tags彼此間的關係(relation),最直覺改進tag cloud這種缺點的作法或許是秀出指定的tag的同時也將與該tag相關的tags一併連結秀出來,如此該tags相關性(經常可能被同時使用)就顯而易見,對使用者而言,該resource的結構也就不言而喻了。

想說去找看看這個idea有沒有人做了(在找之前其實就覺得這麼直覺的東西應該有人把它做出來了吧XD),果然.. Elastic Tag Maps用Flash實作了這個想法,當你滑鼠移到tag cloud上的某一個tag時,它會將與該tag相關的tags同時link起來秀了出來。此外,它也把tag's frequency的histogram畫了出來,相關的tags被點擊後,histogram會同時動態秀出對應的分佈。我在想,del.icio.us的tag prediction或許是用類似的概念做出來的吧~

不過,我覺得這個Elastic Tag Maps還可以進一步改進,譬如說,根據user的興趣在tags加上不同的顏色或明暗度,如該tag是不是最近常被使用的熱門tags,或者根據不同主題將tags作分群(clustering),又或者tags彼此間的相關程度等等。不過直覺跟我說這應該還是有人做過了XD。



Tuesday, November 27, 2007

Coffee Drinks Illustrated

不知道常喝咖啡的大家,對咖啡有多少認識呢?咖啡的種類眾多,個別的成份與沖泡製作方式更不盡相同,如果能夠對各種咖啡有一些基本的認識,或許對於選購咖啡會有一點幫助喔!Lokesh Dhakar針對不同種類咖啡的成分畫了一個不錯整理,讓人看了一目了然呢!

PS. 下圖中的Espresso中文稱作濃縮咖啡,是將水在高壓下迅速流過咖啡粉,將咖啡的菁華Crema萃取出來而製作出來的。

EspressoEspresso Macchiato
濃縮咖啡焦糖瑪琪朵
Espresso con PannaCaffé Latte
濃縮康保藍拿鐵
Flat WhiteCafe Breve
白咖啡Cafe Breve
CappuccinoCaffé Mocha
卡布其諾摩卡
 
Americano 
美式咖啡 



Funny Videos to Introduce Social Network

你還不知道什麼是"Social Network"嗎?以下這兩個可愛的小短片,用最簡單的方式配合上生動的例子,為你介紹當紅的Social Network,並說明了Social Network隱含的價值(Value)。雖然並沒有講到它的精隨,但挺適合入門的人看喔!

Social networking in plain English

順便介紹dot Sub這個網站,它提供為影片加上字幕的服務,拿上面那個Social Network的例子,經dot Sub加工後,可以在下面看到。我覺得它可以拿來做聽力訓練或教學,彌補了YouTube多數影片沒有字幕的小缺點,挺適合我這種英聽超爛的人XD。



Monday, November 26, 2007

To Develop Web Applications

對現代人來說,網際網路幾乎是不可能從生活中抽離的,許多線上服務更是琳琅滿目、不斷推陳出新。我想試著從web設計者的角度重新思考這些網路應用程式(Web Applications)的服務,究竟為何而開發呢?而Yahoo! Search設計總監Bob Baxley是這樣解釋的:「The fundamental purpose of Web applications is to facilitate the completion of one or more tasks.」因此依據tasks的類型與複雜度,許多技術方案自然應不同服務與互動需求而被開發出來了,如Flash, Java applets, DHTML, Active X, Smart Clients, Java Web Start, SVG等。然而,對網站設計者而言,何種技術對自己的目標是較為合適的呢?各種技術又能夠支援什麼形式的互動與視覺會呈現呢?又各種技術的長處與限制?這些問題是網路應用程式設計者經常碰到的,因此,我想對這些主流的技術作一些優缺點的分析、比較、trade-offs的整理,以釐清一些實務上的迷思。

首先,到底什麼是Web Application呢?可以把它想成是web-accessible(透過瀏覽器呈現web)、web-connected(藉由HTTP connection來存取資訊)、以及task-oriented(不單只是瀏覽資訊而是有特定目的)的軟體。網路應用程式的本質種類繁多,Luke WroblewskiFrank Ramirez定義了從thin client到rich client的一套連續集(continuum)來區分不同網路應用程式的定位,以下我逐一介紹。

Thin Client

我們最常接觸到的網路應用程式種類,它仰賴client端瀏覽器來做事情,如安全性、狀態管理(state management)、以及腳本語言的執行(script execution, run-time),並且在遠端server處理並儲存資料,Server的request與response大多透過HTTL protocol。Thin Client有幾個主要的好處:(1) wide reach,任何人都能透過瀏覽器access web;(2) open development platform,它建立在廣為大家接受的公開標準上;(3) no footprint,具備快速下載的能力,除cookies外,並不會在本機端作任何手腳,不過造成一個問題是,每次關閉瀏覽器之後,都必須要執行重複的動作以便查閱資料;(4) deployment and manageability,分散式並且由一個點統一維護,其功能完全存在於伺服器端,客戶端完全不需要進行任何安裝與部署的工作。不過也具有一個致命的缺點,即資料往來相當消耗網路頻寬,資料傳輸量很大時,將嚴重導致程式的反應速度變慢。Thin Client主要使用的技術有以下幾種:

HTML, XHTML
HTML, JavaScript, and CSS (DHTML)
DHTML, with Remote Script via iFrame
DHTML, with XMLhttpRequest (AJAX)

Rich Internet Application (RIA)

RIA是目前最火紅的網路應用程式種類,它是一支在Web運行的應用程式,具有與桌面應用程式一樣的功能、反應、與體驗,AdobeFlash正是RIA的典型例子。或許有人會說Flash不是只是動畫製作工具嗎?RIA和Flash網站有什麼不同呢?其實他們最大差異在於RIA能夠操作資料並與之互動,而傳統的Flash網站僅止於視覺化的呈現,透過ActionScript控制Flash的行為正符合RIA的精神。

RIA使web內容的呈現更加豐富,藉由在local端與使用者互動,達到多媒體影音內容放送、動畫、即時驗證、以及遠端即時訊息傳送(Java Objects, Web Services, etc.)的功能。Sun的Java Plug-in (applets)與Adobe Flash就是最常見的Rich Internet Application run-times,然而RIAs的最大限制就是只能在具embedded plug-ins的瀏覽器上運作。

Thin Client應用程式所使用的HTTP傳輸層並不一定保證支援訊息傳遞及其完整性,且不支援由server端發起的資料傳輸。RIA所使用的傳輸層正彌補了這項缺點,提供了可靠的訊息傳遞機制,並促使server端主動提供資訊。

Thin Clients可將RIAs嵌於其中(透過瀏覽器plug-ins整合),在DHTML中加入Flash模組是一個代表的例子;而使用asynchronous JavaScript-driven的Thin Clients使用XML對server做requests與responses(就是AJAX)其實也可以視為一種JavaScript RIA。Rich Interest Application主要的技術有:

Flash 6 (and higher)
Java Applets
Active X
Flash with Flex or Laszlo Presentation Server
Microsoft SliverLight
Sun JavaFX

就使用者觀點來說,RIA將是未來Web技術的主流,不過對技術開發人員來講,懂Flash美工又精通ActionScript的人在台灣並不多,而熟悉Server端技術的人卻又不一定了解RIA與Flash,如何整合兼具創意、技術、符合使用者體驗的人,是RIA推廣的一大挑戰。另一方面,目前並沒有一個完全針對RIA開發的工具(架構在.NET Framework 3.0上的Windows Presentation Foundation是嗎?),因此技術門檻以及開發成本仍然相當高,或許將來RIA開發軟體問世後,才會更加普及?不過不管怎樣,RIA的潛力與商業價值是不容小覷的,拭目以待吧!:p

Rich Client (Smart client, desktop client)

簡單來說,也是一種web-connected的應用程式,只不過它並不是在瀏覽器上運作,並且可以離線執行,與本機端的硬體資源與軟體做整合(如同視窗應用程式,Windows Applications),因此其實可以把它想成桌上型軟體。就開發Rich Clients Application來說,程式與資料會被安裝到本機電腦中,而程式運作時會使用同步的方式與底層的資料進行溝通,若資料位於Internet的不同主機上,程式便會使用遠端物件通訊協定和資料進行溝通。Rich Client具有使用者介面豐富、高互動性、易於開發、反應時間短等優點。較著名的Rich Client技術有Windows Smart Clients與Java Web Start。

以下是Luke WroblewskiFrank Ramirez針對Thin Clients與RIA優缺點的比較,並以一張圖說明目前Web技術發展在Thin Clinets, RIA, Rich Clients的continum上的分佈。

The primary benefits of a thin client are reach (anyone with a Web browser can use it) and deployment (can be updated and distributed through a Web server). The primary disadvantages are limited interaction options and typically slower response times. Rich Internet Applications and Smart client technologies enable richer (desktop-like) interactions, more sophisticated messaging, and prevent server request/responses from having to rewrite entire pages. They also maintain some of the deployment and updating benefits of thin clients. The chart below overlays popular Web application technology solutions on a continuum from thin to rich client. Most solutions fall within a range on the continuum.



Friday, November 23, 2007

生平第二次上課

沒想到生平第一次上課與第二次上課時間上會相距這麼近Orz,但所面對的聽眾卻大大不同啊..上次是回政大幫學弟妹上資料結構,這次是Shou-de老闆請我在machine discovery課堂上簡介social network,台下坐的ㄧ半是比自己大的碩二與博班學生,心態與壓力差好多喔..昨天還因此小小失眠呢>< 雖然我儘量把它當成是比較大的group meeting來講,不過剛開始的時候,還是一個字「抖」,講到small-world experiments時,或許是比較多人聽過,發問一度踴躍,還好有老師罩我XD 不然有些問題我一定沒辦法正確答出來..

其實站在台上我也偷偷觀察了上課的情況(我想應該跟平時老師上課的情況差不多吧),平均大概有7~8個人在睡覺XD,好像女生比較會作筆記XD,有帶筆電的幾乎都會用筆電,坐前面的普遍比較專心,還有..好多雙眼將都對著我看orz..我覺得上台present要能夠讓台下聽眾覺得不枯燥是件非常不容易的事,特別在聽眾都比自己年長時,而且會擔心是不是某些地方講的含糊不清或漏講了什麼,或許說,那種大家都專注傾聽自己說的一字一句的感覺,是最令人感到放不開的XD 不過換個角度想,只要簡短幾句話,大家能了解自己想傳達的是什麼,不必像上基礎課程一樣反覆從不同面向解釋某一個觀念。此外,如何吸引台下聽眾的興趣,我覺得自己做的很差,語氣平淡沒有抑揚頓挫的氣勢,好的內容都被我講爛了orz 而感受聽眾的反應就更不用說了,今天我完全沒有去做,就只顧著講啊..XD

對於presentation,我想自己還有很多地方得學習,以後坐在台下上課時,試著揣摩講者的心思,並從他們身上挖掘並體會presentation的奧義吧!XD



Thursday, November 22, 2007

Light Cavalry Overture

奧地利作曲家蘇佩(Franz von Suppé)的《輕騎兵序曲》(Light Cavalry Overture),最令我懷念的曲子,旋律簡單易懂、輕快舒暢。記得國小隨參加樂隊,我是練口風琴的部份,我們參加南區國小組音樂比賽就是以這首輕騎兵作為自選曲,每天利用早上升旗時間與午休時間練習,最後可得了優勝呢!

Suppe的許多交響樂作品可說兼融開朗的義大利情調與優雅的維也納風格,而其最經典的序曲(overture)莫過於《輕騎兵》與《詩人與農夫》了。如果記得沒錯,輕騎兵是根據一位著名維也納詩人的詩所改編而成的輕歌劇,主要描述一支精銳部隊出征的盛況。樂曲一開始以小喇叭與法國號作為出征的號角,接著銅管呼出了蓄勢待發的氣勢,隨後透過提琴展現先鋒部隊穿梭於戰場的答答馬聲,在向主帥回報戰況的信號後,雄壯地展開了全面性的殺戮,令人屏息的短兵相接氣氛瀰漫整個原野。到了樂曲中段,節奏明顯緩和,豎笛聲娓娓透露著弟兄們戰死沙場的哀戚,一天的征戰隨之落幕。喝著嘹喨的戰鼓聲,另一天的激戰展開,節奏再度回到輕騎兵輕快的蹄聲,愈戰愈勇,壯士斷脕的決心將氣勢帶向高潮,最後在所有樂器齊鳴的振奮中,以壯麗之姿,宣示贏得一場漂亮的勝戰。

為什麼會突然想到這首曲子呢.. 最主要是昨天在愛樂聽到,勾起一些回憶,而且,明天得在老闆machine discovery課堂上present social network,超緊張,彷似出征般,用來提振士氣 XD



Thursday, November 15, 2007

生平第一次上課

今天回政大Man-Kwan老師代課資料結構,是生平第一次正式站在台上面對一大群人教課,和平常在meeting報告論文的感覺大不相同。Group meeting報paper時,台下坐的是老師與研究生,人數不會太多,因此很容易能夠針對特定問題產生討論,同學或學長姐聽到有問題會立刻發問,互動性多能自然形成;而對教課來說,在台上台下的互動幾乎得由講者掌控,講者的肢體動作、表情變化、言語音調等,都緊緊影響學生的學習效果... 此外,在許多時候,必須比在報paper時更敏銳的觀察學生的反應(因為學生通常聽懂或不懂是不會有反應的 XD),或者得嘗試營造出讓學生容易產生回饋的情境。以上我都做的不好...

我是一個很容易緊張的人。從小到大,不論是不是站在台上,只要是面對一群人講話時,必定心跳加速,全身不自覺抖起來,說話上氣不接下氣,使得說話重點模糊,時常忘記想說的是什麼,不容易從聽眾的角度來講。雖然已經經過許多次報paper的歷練了,但準備得再充分,始終克服不了心裡面那層表達的障礙,因此很佩服那些在台上說話能說的自然、流暢、風趣、且能吸引聽眾專著的人。

以前是坐在台下聽老師上課,真沒想到有一天自己也會站在資科系3301教室替學弟妹們上課,感覺真是奇妙!:p



Tuesday, November 13, 2007

棕髮女孩

除了耳熟能詳的「月光」(Clair De Lune)外,德布西(Claude Debussy)另一首深受大家喜愛的曲子便是「棕髮女孩」(La fille aux cheveux de lin),而這首抒情小品的創作靈感是源自法國詩人路康德(Leconte de Lisle, 1818-1894)的詩集「蘇格蘭之歌」,它是收錄在德布西「鋼琴前奏曲」中。德布西的鋼琴前奏曲集強烈隱含印象樂派的風格,當中每首曲子的主題小字被寫在樂譜的最後面,其用意在於不希望聽眾拘泥於文字的描述性給旋律先入為主的印象。印象樂派的核心精神正表現於此,他們嘗試透過視聽覺的觀摩與聆賞來觸發心中感知的意象,讓聽眾留下對某一事物似有若無的印象,而「前奏曲」自由的表現方法正是傳達這種即興、充滿幻想的獨特感覺的最佳形式。

降G大調的棕髮少女呈現了恬靜唯美的音樂表情,一如曲名,彷若少女輕柔而隨風飄逸的髮絲,幽幽而純粹、自然卻不著痕跡,藉由音符不自覺地引人入如詩似霧的夢境氛圍,非常適合在靜謐夜裡伴隨著一聲晚安使人舒舒服服地入眠。附上米開朗傑里(Arturo Benedetti Michelangeli)版的棕髮女孩: Michelangeli - Debussy - La fille aux cheveux de lin.



Monday, November 12, 2007

梁靜茹-崇拜

曲:彭學斌 詞:陳沒 唱:梁靜茹

你的姿態 你的青睞
我存在在你的存在
你以為愛 就是被愛
你揮霍了我的崇拜

我活了 我愛了 我都不管了
心愛到瘋了 恨到酸了就好了
可能的 可以的 真的可惜了
幸福好不容易 怎麼你卻不敢了呢

我還以為我們能 不同於別人
我還以為不可能的 不會不可能

你的姿態 你的青睞
我存在在你的存在
你以為愛 就是被愛
你揮霍了我的崇拜

風箏有風 海豚有海
我存在在我的存在
所以明白 所以離開
所以不再為愛而愛
自己存在在你之外



Thursday, November 08, 2007

小螢的青春

「不囧~(部長)」、「阿齁米亞(傻宮)!」,綾瀨遙飾演的魚乾女雨宮螢令人驚艷啊!就像交響情人夢裡飾演野田惠的上野樹里一樣,彷彿將自己融入角色了,每個小動作都自然、精準地透過表情與言語上的喜、怒、哀、樂,將內心狀態做了表露無遺的完美詮釋。哈~無論是烏龜女、蛇女、無臉女,還有與藤木直人飾演的「不囧」在地上翻滾、做奇怪的動作,都令人笑開懷、印象深刻啊!特別是許多穿運動服、綁著沖天炮坐在後廊上喝著啤酒、發呆、聊天的橋段,可以說是這部日劇的代表畫面,好喜歡這種與一個人毫無拘束地做「真實的自己」的感覺~

「小螢的青春」(或稱「螢之光」)的根本精神就是「魚乾女」,其實跟現下常說的「宅男」沒兩樣,而這種精神在愛情裡面是不是會產生什麼作用呢?當最真實的自己遇上帶有美好、完美、理想性的深刻情感時…「你不是害怕讓他看見穿著運動服一手拿著啤酒躺在地上的你,而是害怕和你喜歡的他更深入地面對彼此,因為害怕所以你才覺得麻煩。」這句話點出了背後的意涵。「其實願意在戀人面前盡情展現自己,以及被接受那樣的自己,不刻意做作,也許才是最幸福輕鬆的吧...」講的就是坦誠,「完美」的形象…紙是包不住火,雖然人在受到拘束或不滿什麼事情的時,是能隱藏在內心的,但形於外的言談舉止是難以掩蓋的。在前往所謂「親密」的路上,無論大小事、好事或壞事都是共同經歷與承擔的,快樂因分享而加倍,憂傷因分享而減輕,尤其對於感情世界的兩個人,這種情感交遞感受程度是更為強烈,也因為對於彼此有著一種獨特的信任,會有包容,於是哪怕挑戰彼此固有的價值觀,因為建立在「在乎」上,勇敢而適度的表現自己,才有溝通、了解與磨合的機會,人與人相處的默契與好感不正都在這種自然且真實的狀態下形成的嗎?我想,不論親情、友情、愛情,皆為如此吧!

「在記憶中,那是很久以前某個夏天的事情。曾讓我想起那天在我小手中的螢火蟲,小小的,現在似乎已經快要消失了的,短暫而又微弱的光芒。」嘗試找出自己最真實感覺的歸依所在,而非是為了戀愛而戀愛,聆聽自己的心音,感覺最自在舒服時,那或許才是最適合自己的吧!

後記:去查了「干物女(男)」(魚乾女(男))現象的意義:可視為長久過著嚴謹群體生活的日本社會的一種反動。但這群人並非懶惰或者毫無原則,相反地,他們其實是以有原則的方式過著干物生活的。工作上勤奮、認真、盡力達成的原則是絕對不會改變;就算是下了班後,再怎麼放鬆不注重細節的生活,也僅限於自己一個人的狀態,不會去做干擾別人或者失去了基本的禮儀應對。



Tuesday, November 06, 2007

Bolero

來推薦一首我相當喜歡的古典名曲─拉威爾(Ravel)的波麗露舞曲(Boléro)。這首曲子被稱作是「十四分鐘沒有音樂的管弦樂演奏」,也就是曲子裡面的旋律少得可憐,僅僅不過是由許多漸強與反覆所組成的而已。然而,神奇的是,稍微懂得音樂的人只要聽過都會愛上它哩!來,聽看看就知道~ :D

Boléro是拉威爾替俄國著名女舞蹈家魯賓斯坦(Ida Rubinstein)所寫的芭蕾舞曲。故事是有一天拉威爾心血來潮,想挑戰管弦樂團音響效果的極限,於是便以西班牙的「波麗露舞曲」風格為整首曲子的架構,配合各種不同管弦樂器的使用,完成了這兩段主題交響樂。值得一提的是,不同樂器相同主題竟然前後反覆了九次之多!此外,隨著曲子進行中不斷的樂器加入,其音量也由若漸強、持續提升,彷彿將人的思緒帶入一股帶有神祕東方色彩的氛圍裡,引誘人們的好奇心與欲望,愈入愈深,不安的因子從詭譎繚繞中蔓延開來,直到聽到開水滾了的聲音,才驚覺心中的大小泡泡早已抓狂似地翻滾。

俄國著名作曲家史特拉汶斯基(Igor Stravinsky)形容拉威爾是「最精確的瑞士鐘錶匠」。就拿Boléro來說,感覺拉威爾對各小節的節奏與速度都經過相當謹慎的度量,將曲子裡面的反覆效果層層堆砌,並且賦予它們不同的音樂色彩,直到對聽眾產生一種蠱惑的魔力,莫名地產生的騷動,甚至燥熱感......



Monday, November 05, 2007

Tagging from System View

再來,整理一些關於目前網路上現有tagging應用的類別。大致上,tagging systems可以依據以下兩類來分析:(1)系統設計上的特色,以及(2)個人使用tag的動機與目的。此二者對於最後所有被annotated的tags可以傳達的意義、資訊如何在使用者間流動與互動、後來使用者tag的意願等都有舉足輕重的影響。這裡主要著重在系統設計上的一些介紹,從使用者的觀點下一篇再寫。

A. Tagging Rights
這或許是影響整個tagging system最大的部份,可再細分為三類:
self tagging: 使用者能夠tag他自己所製造的source,如Technorati
free-for-all tagging: 任何人都可以tag任何source,如Yahoo! Podcasts
permission-based tagging: 系統允許不同層級的tagging權限,如系統指定source給使用者tagging(如ESP Game)、使用者具體指明哪些人能夠做tagging(如Flickr: friends, family, contact distinctions)。相對地,系統也可以決定讓哪些人能刪除已標註的tags:任何人都可以刪除tags(如Odeo),只有創造該tag的人能夠刪除它(如Last.fm),或者只有source的擁有者能夠刪除(如Flickr)。
由此看來,selg tagging明顯是較能夠採集到更廣泛的tags,也就是同樣一個tag所代表的涵義可能會隨著下tag的人的族群或類型而不同。

B. Tagging Support
tagging的機制對整個tagging系統所呈現的行為也有影響很大。大致可分為三類:
blind tagging: 使用者無法看到其他人對相同source下了哪些tags,如del.icio.us
viewable tagging: 針對同一source,使用者看得到已經被下過的tags,如Yahoo! Podcasts, mybloglog。不過,此種tagging方式將可能使特定的source被overweighting。
suggestive tagging: 使用這下tags時,系統會自動建議相關的tags,如Yahoo! MyWeb2.0, del.icio.us
其中suggestive tagging的方式有助於使tagging system趨向於folksonomy,也就是協助整合(或收斂)針對特定source的tags usage。

Folksonomy「群眾分類法」是Thomas Vander Wal所創,由folks與taxonomy所組成,指個人運用自由定義關鍵字的協同分類,其形成通常必須滿足以下幾個特性:

a. 資料量龐大時: 在使用者沒有training任何依據來分類的情況下,下關鍵字或定義必定存在盲點或發生錯誤,但若資料量龐大且具重複性時,相同內容可能被許多不同關鍵字標註,其搜尋結果反而能趨近涵蓋各個面向。

b. 適用非學術/非精確/非嚴謹的領域: 若是特定的專門領域,肯定會存在許多相當嚴謹且精確的術語來對某一概念或事件做描述,但對普羅大眾而言這是難以達到的。

c. 配合indexing使用: 不管用哪一種index方法所做成的系統都得結合關鍵字,以達到關聯分析,譬如某些關鍵字與哪些關鍵字時常同時被標註,如此才能提供使用者較為完整的資訊。

其實社會科學領域早已對"Folk Classifications"(非專業人員如何進行分類),做了相當程度的研究。可以參考Harold Conklin的《Folk Classification: A Topically Arranged Bibliography of Contemporary and Background References Through 1971》(1972, Amazon)。
而且Folksonomy與圖書資訊學中的「分面分類法」(Faceted Classification)是沒有直接關係的。

C. Aggregation
所指的是對同一source,其tags使用的重複性(multiplicity),即是否允許不同使用者下相同的tags。
bag model: 允許不同使用者對特定source下相同的tags,如del.icio.us
set model: 針對同一source,即使是不同使用者下tags,也不允許重複的tags出現,系統會自動將相同的tags識別為單一tags,或要求使用者不能下已標註的tags,如YouTube, Flickr
對於使用bag model的tagging systems,必須要有能力以統計的方式將特定source、不同使用者集體下的tags呈現出來,如del.icio.uspopular link。甚至要進而能夠從這些被不同使用者下的相同tags中找出sources, tags, users間彼此的關係。

D. Type of Source
被tagged的source的類型也是tagging system所必須考量的,而廣泛來說,目前tagged source不外乎webpages(del.icio.us), bibliographic material(CiteULike), blog posts(Technorati, LiveJournal), images(Flickr, ESP Game), users(LiveJournal), Video(YouTube), audio objects such as songs(Last.fm), podcasts(Yahoo! Podcasts, Odeo), physical locations or events(Upcoming).
當然,針對不同類型的sources,被下的tags的用語與意義也就大不相同了,不過因此也衍生出multimodality correlation的研究議題,也就是能否針對同一tags名稱找出不同type的source彼此間的關係,譬如替multimedia analysis提供了許多現成的training data。

E. Source of Material
Source的來源是由誰來提供呢?是普羅users嗎(如Flickr, YouTube, Technorati, Upcoming)?還是系統提供呢(如ESP Game, Last.fm, Yahoo Podcasts)?甚至,來源是整個web的任何東西哩(如del.icio.us, Yahoo! MyWeb2.0)!

F. Resource Connectivity
在tagging system中sources彼此間是否存在隱含的關係呢?答案是肯定的。在此先不談理所當然地由tags建立起的sources的關係。Sources可以由直接的hyperlinks建立關聯(如webpage)、根據系統區分或使用者指定的group來串聯、藉由相同或接近的時間、地點、立場來建立事件的關連(如Upcoming)。這些不同關聯方式的背後隱含的是,相同關連下的sources,他們的tags很有可能類似,甚至相同,尤其在suggestive tagging與viewable的系統中。

G. Social Connectivity
上面講的關連是針對sources,那麼users彼此間的關係又如何呢?在有些提供social network service(SNS)的tagging system中,會根據使用者的興趣、所在地、教育背景、職業等等來協助建立彼此的關連、或以對稱(symmetric, know each other)或非對稱(asymmetric, A know B, B doesn't know A)的方式(如Flickr就未必是symmetric的),讓使用者間有機會形成社群,或者說是localized folksonomies。

後記:挫賽... 明天要MMAI期中考,我竟然還在寫這個 = =+


Share to Learn

Psychologist William Glasser quote,

Here is the quote for the sake of posterity.

We Learn…
10%…of What We Read
20%…of What We Hear
30%…of What We See
50%…of What We See and Hear
70%…of What We Discuss With Others
80%…of What We Experience Personally
95%…of What We Teach Others
William Glasser


Saturday, November 03, 2007

Tag Visualization and TagOrbitals

Web2.0當紅,social tagging也是其中一環。在目前許多tagging system,一個source可以以一個以上的關鍵字來當作它的tag,也就是這個source可以從許多不同的面向來替它分類。然而,當我們的source種類很多、或者數量很大時,tag的數目隨之成長,甚至類別可能變得相當繁雜。Tag visualization的議題正是由此誕生的,目的是嘗試找出較為人性化的indexing呈現方式,協助個人化管理與搜尋。

傳統呈現關鍵字或類別的方式是階層式的(hierachical),而web2.0打破這種固定結構化的呈現方式,轉為比較自由的形式。最廣為人知的標籤視覺化有兩種,一種是以graph,或者稱做network的方式,如下圖所示;

另一種是"TagCloud"(標籤雲),Tag Cloud將使用者所標註的tag以特定的方式排序(通常為字母順序),同時每個tag會根據被使用的頻率而有字體大小的差別,如下圖所示。目前許多Social media網站都使用了Tag Cloud,如Technorati, Flickr, del.icio.us。使用Tag Cloud的好處是輕巧簡潔,然而,這種優點卻是犧牲了一些重要的資訊而換得的,也就是它忽略了tag與tag之間隱含的關係。

最近在survey關於tagging的研究時,發現了一種新的tag visualization方式—TagOrbitals。它是IBM ResearchBernard KerrSIGGRAPH 2006 Sketches提出來的。TagOrbitalsTagCloud的呈現概念背道而馳,它犧牲了簡潔輕巧來換取tags之間關係的資訊。TagOrbitals的視覺化呈現如下圖。

由上圖可以很清楚地看到它的結構,是將每個tag放在一個類似原子的中心(也就是原子核的位置),原子核的外面有許多能階軌道(obrits or bands),跟中心tag相關的所有tags會依據和中心tag共同被標註的頻率來分配所在的軌道,共同出現的次數愈高,愈有可能被放在接近中心tag的軌道,如此便可看出那些tag較常被標註在同一群,tag在語意上的階層種類也一目了然。另一方面,被標註的source的title也同時秀在這個原子結構中,如下圖所示,title會被垂直地放在由內而外所屬的標籤旁,因此有哪些sources是被相同tags所標註的也就得知了。

最後,每一個tag都會有自己的原子結構,tag名稱放在原子中心,而各原子tag的名稱大小也根據出現次數多寡來決定,同時所有tags都是由左下角如泡泡般地生長出來的,如下圖所示。



Thursday, November 01, 2007

The Wisdom of Crowds

The Wisdom of Crowds: Why the Many Are Smarter Than the Few and How Collective Wisdom Shapes Business, Economies, Societies and Nations 是 James Surowiecki 在 2004 所寫的,主要在探討是否三個臭皮匠能勝過一個諸葛亮,並告訴我們群體的決策思考是比一小群菁英還要正確聰明的,透過群眾的力量,更能蘊釀出創新,解決難題,甚至能準確地預測未來。我整理了以下構成群體智慧的四個重要元素。

1. Cognitive Diversity (多樣性)
Increases range of solutions, Reduces Groupthink

如果一個群體的成員全由菁英組成,即使成員來自各個領域,所做的決策很有可能侷限於他們類似的思考的模式,但若成員在思考層面較為多元,白話來說就是龍蛇混雜,如此群體思考的能見度與廣度將可大為提升,決策也較不容易有盲點,並能趨進各種情況都被涵蓋的程度。此外,多樣性能降低判斷中各種邏輯上出現謬誤的機率,增加正確資訊的選項。從另一個角度來看,一旦成員構成複雜,就較容易避免從眾的現象產生,任何人的想法都會受到挑戰,群體也就能激發出更多的創意了。

2. Independence (獨立性)
Relatively rare on current web, Reduces Groupthink

每個個體是否具有獨立思考的能力在群體智慧中扮演著關鍵的角色,最主要的原因是它能使錯誤不會綿延地在個體上發生,部分切斷了錯誤訊息傳遞關連性,因而群體的判斷不容易受到誤導。此外,獨立性具有另一種涵義:個體能夠保有演化資訊、產生新想法的能力。

舉兩個例子來說明或許會更容易理解。著名生物現象-蟻群的 circular mill 正是因欠缺獨立性導致群體危機的最佳例子。Circular mill 指的是螞蟻在找不到路時,會循著同伴所留下來的氣味前進,而不會去思考新方向。另一個是 1:100 vs. 1000:100000:一百個人裡面有一個人抬頭看天空,可能只有身旁的幾個人會受影響跟著抬頭;但十萬個人裡面有一千個人抬頭看時,雖然同為1:100,卻有可能大部分的人都受到影響。

若群體的成員純粹以旁人的行為作為自己決策的依據,當資訊流量超過某一 threshold 時,自己所有擁有的資訊將會很合理地被隱藏了,或者變得只接受來自外界的資訊。這就是缺乏群體智慧獨立性的一種典型。

3. Decentralization (分權化)
Better decision making

簡單來說,就是讓決策在最接近問題的地方形成,鼓勵竭盡局部知識做到專業化,或者根據週遭情況來做出最適切的反應,或者藉由自身過去經驗使得解決方案能最貼近問題的核心。最簡單的例子就是大型軟體設計的分工,設計流程的各個 components 分屬不同人員來負責。然而,此分權化的概念必須在群體內部具有一種能整合 (aggregation) 溝通各個子集資訊的管道或機制,才能做成一個較好的群體決策。

4. Easy Aggregation (整合機制)
Allows collective decision making

一種將個別資訊轉換成群體決策的機制。白話來說,就是「我覺得你會怎麼做(或者猜想你可能怎麼做),然後決定我怎樣做」的意境,也就是個體們透過內在的文化跟習俗、外在的規範法律或者該種群體的共通經驗等等默契,而自然的整合起來。例如公共場所人群的移動,看似各人按照自己的意識行走、毫無規則可循,但潛在的統合力使得群體能夠自然地找到移動的節奏與方向。排隊、先到先排也同樣是一個例子。

此外,James Surowiecki 提出了,五種造成群體智慧失敗的元素:

1. 同質性太高(Too homogenous):群體組合愈多元,群體智慧愈能展現。
2. 核心性太強(Too centralized):決策模式過度集中於金字塔頂,忽視下層意見。
3. 隔離性太大(Too divided):群眾應該多元,但不能被隔離;隔離使意見無法自由交流。
4. 模仿性太高(Too imitative):楬櫫少數意見,讓群眾不思考就模仿。
5. 情緒性太強(Too emotional):情緒因素(例如:族群、宗教、階級等)都很容易造成同儕壓力、群體情緒失序等。


My Boss My Hero

「ううううう...梅村さん...」哈哈... 這真的是一部可以讓人笑開懷的日劇啊!將熱血的青春被描繪得淋漓盡致,一集接著一集不知不覺就看完了 orz 看完之後再去回想,最令人印象深刻的莫過於Makki誇張的臉部表情了,超有漫畫效果的!編劇在許多橋段都利用這種誇大的手法來鋪述笑點,並藉以呈現Makki的「真」,引領觀眾進入Makki的內心世界,同時跌跌撞撞的過程中,替他往後的成長埋下伏筆。也就是,把自己的視角放低,心自然而然能貼近到生活的真實面,感受旁人的心聲,領悟其中的小小感動。

此外,我很喜歡劇中那許多價值觀衝突與矛盾產生的時候,可以發現許多有趣的對白與畫面正是在刻畫強調這些點,這些成長的轉捩點。其實,人生經歷的體會,不就都發自這些點嗎?當自己無法改變環境時,只有試著去面對它、接受它,才有跨過這道牆的機會。Makki就是在不斷地妥協與接受中,學會了如何與人相處、經營組織、解決問題。「來這裡學習、聊天、吃飯,有一天越過了這種悲傷的時候,你肯定會比現在還要堅強,那才是真正的堅強。」

最後的結局,雖然令人惋惜,但我們的的確確見到一個脫胎換骨的Makki。也許每個人的心裡面都住著一個小孩子吧!而一次又一次的感動證實了它...