Wednesday, April 18, 2007

"china" "chinese" in del.icio.us

有些朋友可能知道 俺對於del.icio.us有點痴迷

所以俺的畢業論文  就是以del.icio.us為研究對象

其中很重要的一部份  就是標籤跟標籤之間的關係

每個人的腦袋裡  都有一份對世界的認知 俗稱常識 

哲學家跟電腦科學家各自定義了ontology來理解人們怎麼理解這個世界

del.icio.us之所以令人興奮 在於這是史上第一次有那麼大一群人 

把腦子裡對於世界的認知給表示出來

儘管初始的使用者大部分跟我一樣是宅界的同胞

讓分析出來得認知可能有點偏頗

不過隨著使用者慢慢擴散到別的族群

del.icio.us已經慢慢的能夠讓人感覺到它能提供的世界觀了

因此  我突然想知道  "中國"跟"中國的"

這兩個標籤  距離有多遠

答案請見這兩張圖 

先容我解釋一下這兩張圖是怎麼畫出來的

跟黃色標籤最有關係的十一個標籤都會出現在圖裡面

以距離表現他們的密切度(兩個標籤曾經被標在同一個網頁上的次數)
















China 看來跟政治,旅遊,比較相關

tourism,travel,tours,tour,rica

shanghai,washington,beijing,news,japanese

另外台灣根本沒出現在這張圖上面 日本卻有

這多少能解讀為 中日關係比中台關係更受到這群讀者的重視

另外天外的飛來了female這個標籤  
我決定更深入的挖掘被標上這兩個標籤的文章 仔細一瞧 
發現都是一些女性在中國地位改變,抬頭的文章  
算是挺正面的  
當我個別分析female這個標籤的時候
結果令我怵目驚心 因為跟female相關的標籤 
竟然都是一些侮辱詆毀以及色情的字眼



這張圖裡 我們看到跟"中國的"最相關的一大類是服裝布料

諸如dress wedding clothes swimmingsuits swimmingsuit nanhuagin(南華錦) 都出現了

中國的成衣代工產業相當蓬勃 需求面可以在這裡看到

另外japanese這個標籤又再度出現了 跟中國的距離 還是比台灣近

我找了一下japanese chinese共同標記的文章 發現都是一群語言的工具網站為主

日本人學中文的努力 看來相當受網友肯定

"taiwan"+"chinese" 出現的多半是台灣的部落格文章





總和兩個圖來看

中國 跟中國的  兩個標籤彼此都排不進對方的前十一名

我又測試了其他的國家 發現這算是個普及的現象

xx國 與xx的 標籤大多不太熟

有時間再來把所有的國家統計一下再寫一篇




胡言亂語結束 下台一鞠躬

Labels: , ,