2008年10月27日

10/28 Regular Meeting: Monority Report in Fraud Detection Classification of Skewed Data

摘要:
本篇論文提出一個新的詐欺偵測方法,根據現存的詐欺偵測系統以及minority report,處理與skewed data有關的資料探勘問題。

本篇論文提出的方法使用Backpropagation (BP),Naive Bayesian (NB),及C4.5演算法,配合over-sampling的方式。獨特的方在於使用一個meta-classifier (stacking),選擇這些比較performance好的base classifiers,再將這些base classifiers的預測合併 (bagging),用以改善cost savings (stacking-bagging)。

實驗的結果證明stacking-bagging的performance比起傳統的algorithms要來的好。

接著,本篇論文比較新的詐欺偵測方法與C4.5使用undersampling、oversampling、SMOTE。結果顯示當給予一個固定的決策門檻及cost matrix,partitioning和多個演算法的方式會比以整個training data set方式有比較高的cost savings。

以下是論文連結
論文連結