此篇論文提出了一個解決搜尋引擎回傳的搜尋結果中同名同姓的問題。用搜尋引擎查詢人名時,搜尋引擎回傳的搜尋結果常包含多位同名同姓的人,不僅沒有分門別類,還將同一個人的資訊分散在搜尋結果中,讓查詢者非常不方便。此篇論文提出Multi-Faceted Approach,對Attribute、Links及Page Similarity分別都作Confidence Matrix,再使用Stanford certainty theory將三個Confidence Matrix合併。之後,利用Final Confidence Matrix作Grouping,即可以得到同一個人的搜尋結果會在同一群組中,而且仍保持搜尋結果的資訊及編排的順序。實驗結果顯示效果頗佳。
2010年6月2日
Two Birds with One Stone: A Graph-based Framework for Disambiguating and Tagging People Names in Web Search
此篇問題想解決對搜尋引擎作人名搜尋所回傳搜尋結果中同名同姓的問題。作者將屬性,包含地點、電子郵件、工作單位…等等的資訊,以圖形表示,再給予圖中的點、邊不同的權重值。然後使用分群演算法將圖做分群,即可得到每一個人正確的相關資訊。因為篇幅限制,對於實驗過程有些問題尚未了解清楚。總之,這個方法不但處理同名同姓的問題(Disambiguating),也能將正確的人名與她正確的資訊配對(Tagging People Names),是一石二鳥的好方法。
Namesake
View more presentations from avelinhuo.
訂閱:
文章 (Atom)