首先將原網頁P_old和新網頁P_new表示成DOM Tree然後執行以下步驟:
- 找出Fix Nodes:Fix Node代表在P_old及P_new中內容重複的node。
- 產生Reduced Tree:刪除掉P_old及P_new中的Fix Nodes。
- Mapping:此時P_old和P_new都已經成為reduced tree,將P_old和P_new作tree mapping,找出P_new中對應到的目標區塊。
實驗的部分作者測試系統的accuracy和effectiveness,和Direct Path Finding(DPF)、Tag String Matching(TSM)、Tree Edit Distance(TED)三個方法比較。在accuracy部分證明系統可以超過DPF和TSM,並和TED達到一樣的效果; 在effectiveness部分證明系統時間複雜度遠低於TED,並且證明了系統的scalability。
出處:Proceedings of the 16th international conference on World Wide Web (WWW2007)