2007年2月7日

Mining Risk Patterns in Medical Data

Association Rule 傳統上是為了所謂Basket Data所創造出來的規則,每筆資料並無所謂的類別。 因為有規則產生,很自然的可以應用在資料分類上,但是如何處理不同類別所找出的規則?過去有研究試過利用統計檢定(如Chi-square)來篩選這些規則,通常最後則以分類的結果來評估篩選方法的好壞。這篇選自KDD2005的論文,則是利用統計上常用的Relative Risk來篩選optimal risk patterns。Relative Risk本身沒有anti-monotone 的特性,但是在特殊情況下是有anti-monotone的特性,這也是這篇論文最主要的貢獻,但是篇幅關係,作者並未詳列在論文。本篇論文是Industry/Education Track所以較Research Track的內容較淺顯易懂。

沒有留言: