從觀念史看中國近代變遷..jpg

   有些人問我,你讀歷史學然後雙主修資訊科學,兩者有什麼關係嗎?又或者你可從彼此之間得到幫助嗎?如果是在幾個小時前,我雖不願否定,但也很難講出一個道理。有幸今日金觀濤教授來本系講演,才給我上了一課。

    先賣個關子,讓我先談一個資料探勘(Data Mining)中一個為人津津樂道的例子吧!美國的沃爾瑪(Wal-Mart)超市將顧客購物的資料彙整後發現了一個有趣的現象,即每到下班時段有兩樣看似毫不相關的商品會放到同一個購物欄裡面,這兩項商品分別是「尿布」與「啤酒」,原因是什麼呢?因為先生受了妻子的命令要買尿布回家,同時他也順便買了啤酒來犒賞自己,於是沃爾瑪便將兩項商品放到相同的區域以方便消費者購物。故事說到這裡,我們可以思考兩件事,第一,我們要像沃爾瑪一樣把這兩項商品放到同一個區塊,或者我們將兩項商品放到天南與地北,沿途再放些同質商品(如香菸、寫真集)讓消費者逛完整個賣場才拿到這兩項商品,當然必須負擔客源流失的風險。第二,是不是可以進行促銷(特別是下班時段)來增進客源。如果將第一點的和第二點結合,讓消費者又愛又恨是不是可行呢?別忘了折扣的心理解析中也有一個例子:即甲地汽水20元、拖把9000元;乙地汽水15元、拖把8995元。對一個消費者而言,買可樂他可能會選乙地,買拖把則寧可選擇甲地,事實上兩個都是省5元,但因折扣的幅度不同而心理有所差異。至於是否可行則要根據彙整性的資料(Metadata,在此的定義不同於檔案學所用)來做判斷了。

    金觀濤教授今天的演講就提到了他建立的數據庫,數據庫的時間從1830年到1930年,地區則橫跨東亞(在古代東亞地區官方幾乎都是以漢字為主),他針對各領域的代表性字彙作計量,發現1830年到1895年甲午戰爭以前中國人翻譯的西洋書籍中,僅有在儒家可以理解範圍內書才被翻譯,有些西潮的字彙則被「格義」了,例如:「Rights」現在人作權利,看起來似乎不錯,因為權利的意思已與古代不同了,古代的權利更趨近「權勢」的意思,如《荀子‧勸學》:「是故權利不能傾也,群眾不能移也。」以前全中國只有一個人能懂「Rights」,那人即是嚴復,他在《群己權界論》就將「Rights」翻譯作「民直」即一種理所當然的味道,只是時人沒有人重視這個想法,於是今天我們談權利也不說民直了,亦如「經濟」一詞已無「經世濟民」之義。並且金觀濤教授還發現在1904年日俄戰爭後,「立憲」、「共和」的辭彙大量增加,這說明在日俄戰爭前中國還在與俄為師或以日為師之間舉棋不定,直到日本以虛君立憲之姿擊敗俄帝專制,知識分子思想遂產生巨變。依此而論,五四運動以後的思想必另有巨瀾,可惜金觀濤教授未論及此。說了這麼多,就是要強調資料探勘的重要,不妨從英文的字面上來看,Mining是指「採礦」,我們要的是「有價值」的資料,如果收集的是一些無用的數據,那就成了「挖泥」(Data Dredging)了。

    雖然美國「新經濟史派」的羅伯福‧福格爾(Robert Fogel),也倡導「歷史計量學」,並且他傑出的表現使他榮獲1993年諾貝爾經濟學獎。但對於這個方法我是不太樂觀的,因為資料庫學者馬拉卡斯 (George M. Marakas)曾指出別太高估挖礦的成果,因為通常你只能提升3~5%的回報,但他也強調別太悲觀,因為如果不做那你只有不到1%的回報。

創作者介紹

漫遊於歷史與現代之間

okplaymayday 發表在 痞客邦 PIXNET 留言(0) 人氣()