"china" "chinese" in del.icio.us
有些朋友可能知道 俺對於del.icio.us有點痴迷所以俺的畢業論文 就是以del.icio.us為研究對象
其中很重要的一部份 就是標籤跟標籤之間的關係
每個人的腦袋裡 都有一份對世界的認知 俗稱常識
哲學家跟電腦科學家各自定義了ontology來理解人們怎麼理解這個世界
del.icio.us之所以令人興奮 在於這是史上第一次有那麼大一群人
把腦子裡對於世界的認知給表示出來
儘管初始的使用者大部分跟我一樣是宅界的同胞
讓分析出來得認知可能有點偏頗
不過隨著使用者慢慢擴散到別的族群
del.icio.us已經慢慢的能夠讓人感覺到它能提供的世界觀了
因此 我突然想知道 "中國"跟"中國的"
這兩個標籤 距離有多遠
答案請見這兩張圖
先容我解釋一下這兩張圖是怎麼畫出來的
跟黃色標籤最有關係的十一個標籤都會出現在圖裡面
以距離表現他們的密切度(兩個標籤曾經被標在同一個網頁上的次數)
China 看來跟政治,旅遊,比較相關
tourism,travel,tours,tour,rica
shanghai,washington,beijing,news,japanese
另外台灣根本沒出現在這張圖上面 日本卻有
這多少能解讀為 中日關係比中台關係更受到這群讀者的重視
另外天外的飛來了female這個標籤
我決定更深入的挖掘被標上這兩個標籤的文章 仔細一瞧
發現都是一些女性在中國地位改變,抬頭的文章
算是挺正面的
當我個別分析female這個標籤的時候
結果令我怵目驚心 因為跟female相關的標籤
竟然都是一些侮辱詆毀以及色情的字眼
這張圖裡 我們看到跟"中國的"最相關的一大類是服裝布料
諸如dress wedding clothes swimmingsuits swimmingsuit nanhuagin(南華錦) 都出現了
中國的成衣代工產業相當蓬勃 需求面可以在這裡看到
另外japanese這個標籤又再度出現了 跟中國的距離 還是比台灣近
我找了一下japanese chinese共同標記的文章 發現都是一群語言的工具網站為主
日本人學中文的努力 看來相當受網友肯定
"taiwan"+"chinese" 出現的多半是台灣的部落格文章
總和兩個圖來看
中國 跟中國的 兩個標籤彼此都排不進對方的前十一名
我又測試了其他的國家 發現這算是個普及的現象
xx國 與xx的 標籤大多不太熟
有時間再來把所有的國家統計一下再寫一篇
胡言亂語結束 下台一鞠躬
Labels: del.icio.us, 中國, 分析
1 Comments:
原來Del.icio.us可以這樣玩啊!
來去看看"ruby" "python" "perl"好了
:P
Post a Comment
<< Home