2011年4月26日

Ch4.mapreduce algorithm design

Chapter 4 of Data-Intensive Text Processing with Map Reduce introduce the efficiently algorithms, pairs and stripes. It display how to use these algorithms to construct the co-occurrence matrix and how to use this matrix to compute the conditional probability. They compare the time complexity between pairs and stripes algorithms. The stripes algorithms can achieve the better efficiency than pairs, however, the pairs algorithm are easy to implement.

2011年1月25日

AUTOMATIC CONTENT TARGETING ON MOBILE PHONES

因電信市場已日趨飽和,例如歐洲使用手機人口幾乎達到100%,所以電信業者將競爭力轉向加值服務(VAS),期望能有更多收入。但是要如何有效管理數量龐大的VAS,才能大幅提高收入呢?此篇論文提出一個成功的自動化系統,能將最相關的VAS優惠訊息發送給潛在的使用者,藉此幫助電信業者實際增加收益。作者遇到之問題值得我們參考,諸如處理大量的VAS優惠訊息、和每位客戶接觸的機會有限(每天只發送一封MMS,內容包含1至4個VAS優惠訊息)、設備限制(不能達到完全一對一客製化發送訊息,需要將使用者分群)、VAS分類問題等等。此系統最核心之處為根據使用者過去購買紀錄,使用Spherical k-means演算法作使用者分群,並加入最佳化方法。值得注意的是使用者會隨著時間而有不同的興趣,作者實際測試結果,若一直給予使用者同一種廣告,使用者會對此失去興趣,並反映在實驗數據上,所以提供多樣VAS優惠訊息,會得到更優的實驗結果。總而言之,此系統在商業環境中運行長達一年多的時間,並擁有兩百萬的客戶,而且實驗結果顯示最佳化效果顯著、並成功實際增加電信業者的收入。
以下提供讀者參閱該論文,所自行製作的投影片: