2007年2月14日

Social Summarization of Online Auction Feedbacks

這一篇IUI 2005的論文主要解的問題是拍賣網站上對於一個賣家評價的summarization.

一般而言,我們在拍賣網站上想要評估一個賣家時,通常我們會先看其他人對這個賣家的評價,並且以多數人的意見做為此賣家評價摘要的主要內容,換句話說,意見的頻率是文件摘要的主要採用的條件。但是通常這樣的評價都是正面居多,很難得到一個比較真實的評價.因此作者提出先對同一個寫評價的使用者,將其(對於不同賣家)所有的意見整理出來,用以過濾禮貌性敍述(也就是那些對每個賣家都寫的意見),保留比較特別的意見,做為summarization的參考.比較有趣的是如何評估這篇所提的Social Summarization比一般的Summarization 好? 本篇作者以對不同賣家摘要所得的壓縮率標準差來說明,壓縮率標準差大表示所做的摘要較有鑑別度,而實驗結果也的確顯現這樣的現象.

而處理這些feedback的前置作業則是要先將text做意見的擷取,這樣我們才能有效的計算每個意見的頻率.以拍賣網站的意見來說,作者一共歸納了13種feature,共37個feature-value pair.擷取方法是屬於監督式學習,先由標記意見所在的句子,在經過POS Tagging之後,找出frequent patterns,即可做為意見擷取的規則.因此實際應用上是利用一個事先定義的字典,將要擷取的同義字均加入其中.當測試文章有出現這些字時,我們即可應用以上找出的規則做為feature value擷取的方法.實驗結果真正意見的擷取precision為70.8%,recall則為89.5%,而禮貌性敍述擷取precision為93.8%,recall則為80.8%,效果看起來不錯,但是前提是訓練和測試資料筆為100比10.




Systems and Computers in Japan, Vol. 37, Iss. 8, (July 2006), Pages: 38 - 55.