2008年8月27日

8/26 Regular Meeting: Learning On the Border:Active Learning in Imbalanced Classification data

本篇論文著重於某些機器學習演算法,對於資料不平衡(imbalance data)處理效能的問題。

在現實世界中一些需要分類的工作,比方說文字分類、詐欺偵測、醫療判斷等等,若以機器學習的方式處理,該怎樣達到最好的分類效果呢?標準的機器學習演算法對於平衡資料的處理可以達到極佳的預測效果,但是對於不平衡資料的預測效果卻是沒辦法達到要求。

本篇論文解釋何謂資料不平衡,以實驗驗證Active Learning對於class imbalance可以達到不錯的效果,其次提出另一種有效率的方法--以更小的sample pool訓練資料,可以減少計算的時間、減少記憶體的消耗。

1 則留言:

Jahui 提到...

請加論文出處的鏈結.