2010年3月19日

Learning transportation mode from raw gps data for geographic applications on the web

本論文摘自WWW 2008, 主要貢獻在於如何從原始的GPS資料推論出當時的交通工具 (e.g., Car, Bus, Bike, Walk).

方法可分為以下三個步驟:
1. change point-based segmentation method 負責將GPS的trip分割成不同的segmentation, 這裡僅區分成Walk Segment 以及 Non Walk Segment.
2. inference model: 本論文比較四種不同的機器學習方法 (Navie Bayes, Decision Tree, SVM, CRT), 針對每個segment辨識所使用的交通工具.
3. post-processing algorithm based on conditional probability: 有鑒於機器學習推論出來的交通工具有所誤差, 因此最後在用條件機率的方法針對機率較低的預測重新計算.

實驗部份:
GPS資料主要包含45個人約半年的行動資料, 此外評估的準則採用Precision及Recall
實驗結果顯示 decision tree 演算法可產生最好的效能.

以下附上修改原作者的投影片:

2010年3月9日

Retrieving Address Based Locations From The Web

當前主要的搜尋引擎處理基於關鍵字的查詢非常有效。使用者已經在使用這些功能的空間搜尋已知地名。不過,這檢索過程往往很多空間無關的文件。一個空間網路搜尋不僅了解含有使用者查詢的地點,但更重要的是了解在網頁上的位置與使用者的查詢如何能正確地匹配。對於location-based Web search這篇論文實施了自己的地理資訊網路搜尋引擎。其中我們採用的方法所注重抓取的去檢索與位置有高度相關的網頁。為此,我們使用基於geoparser的基礎上的位置分類,以引導Clawler