2008年11月17日

Learning Social Networks from Web Documents Using Support Vector Classifiers

Learning Social Networks from Web Documents Using Support Vector Classifiers出自於IEEE Web Intelligence 2006, 本篇論文主要係透過機器學習的方式自動地去建立social network, 本研究首先假設已經存有不完整關聯 (incomplete relationship), 再透過SVM建立出完整的social network, 其中屬性的建立則是藉由網路文章 (web documents)來產生文件向量. 不難發現作者將判斷social network relationships的問題轉化成傳統的文件分類問題 (text classification problem), 所採用的判斷方法 (亦可視為分類方法) 則是SVM.
此外由於relationships在social network中呈現出不均衡的資料型態 (imbalance data), 此類型資料對於機器學習具有很大的挑戰 (亦即容易傾向將資料判斷成某一特定類別), 作者也採用一般常見的 up-sampling 及 down-sampling 方法來舒緩此議題. 實驗部份採用真實資料集 FOAF (Friend Of A Friend), 評估機制則以Precision, Recall 及 F-measure為主.
以下為投影片:

2008年11月5日

10/21 Data Selection for Support Vector Machine Classifiers

摘要:
本論文介紹MSVM(Minimal Support Vector Machine)分類器,其概念為"基於SVM的架構下,減少其support vectors"。此分類器應用於Fraud detection等含有數以萬計的data points,亦可以增進其他需要大量support vector才能決定的分類器之效能。 
 
內文首先介紹SVM的作用及原理,其後介紹MSVM。此技術使用fast linear programming並加入了error term來減少所使用的vectors。最後提出了SLA(Successive Linearization Algorithm)的演算法來實作MSVM,最後是實驗比較。

將MSVM和FSV以及1-norm SVM對於七個資料集運算的結果做比較,明顯的發現MSVM所使用的support vectors遠低於另外兩個分類器所需要的個數。此外,對於一些資料集來說,MSVM的效能高於另外兩個分類器 。


2008年11月2日

11/11 電腦鑑識程序之研究 A Survey of the Procedure for Computer Forensics

文港主要報告在碩士班的研究,和老師以及同學報告,與否能在資料庫研究上延續,還請老師以及同學多多指教。

摘要
隨著資訊科技的興起與電腦時代的來臨,利用電腦以及網路犯罪的問題,讓執法單位面臨了更大的挑戰與困難,如何利用在電腦上的鑑識工具來取得有效的數位證據,是當前迫切所需要的課題,一般鑑識單位針對無法開機鑑識的電腦主機,大多使用Linux Live CD整合鑑識工具研究,但以目前電腦作業系統來看,以XP作業系統佔有率最高,本文研究提出電腦鑑識程序,利用XP Live CD整合電腦鑑識工具,建置實驗環境,針對電腦犯罪情事,採集相關證據,探討解決方法。通常單一鑑識工具所提出的證據不足,但以測試多套鑑識工具使用,過程中產生的相關癥結,最後彙整鑑識報告,相信能讓調查鑑識人員於數位證據擷取上趨於完善,在法庭呈現上的證據多一分效力。
關鍵字:電腦鑑識、數位證據、Live CD。


電腦鑑識程序之研究
View SlideShare presentation or Upload your own.

資料庫延續
View SlideShare presentation or Upload your own.