2008年1月3日

Data Integration Support for Mashups. & A Framework for Rapid Integration of Presentation Components.

Data Integration Support for Mashups

這篇論文提出一個整合架構,讓使用者將現有的Services資料,透過作者提出的語法整合後轉為新的Service。作者以Online Citation Service為例,建構一個mashup,讓使用者輸入作者姓名,系統從DBLP得到和作者相關的論文,並且以這些論文資料去query Google Scholar,擷取論文的citation count。

作者定義了Query、Fuse、Aggregate、Union等函式,幫助Mashup開發者透過這些函式組合出新元件。而在Query Google Scholar時,作者也設計3個heuristic方式以增加最後結果的正確性。

A Framework for Rapid Integration of Presentation Components

這篇論文提出了一個application level integration架構,讓使用者能夠將現有的網路Services轉化成components,並將components組合成新的Service。

在架構上分成了Component Model、Runtime Middleware和Composition Model三塊。
  • Componenet Model中讓Mashup開發者設定Component的屬性、指令和執行事件。
  • Composition Model可以設定components間事件的呼叫方式,還有資料的傳遞及mapping,並且設定Services Layout Information。
  • Runtime Middleware是一個可擴充的架構,目的在克服相異Services間不同的執行環境可能會造成的整合困難。作者實作了.NET, ActiveX, AJAX等adapter協助component間的溝通。
兩篇論文皆提出了網路服務整合的架構,然而在實驗部分都較為欠缺,對於系統的適應力和實用性其實較缺乏說服力。

以下是兩篇論文的資料及報告投影片:

  1. Andres Thor, David Aumueller, Erhard Rahm. “Data Integration Support for Mashups.” IIWeb 2007
  2. Jin Yu, Boualem Benatallah, Regis Saint-Paul, Fabio Casati, Florian Daniel, Maristella Matera. “A Framework for Rapid Integration of Presentation Components.” WWW 2007

Mining Social Networks for Targeted Advertising

本篇paper的題目是"Mining Social Networks for Targeted Advertising",出處是:"Proceedings of the 39th Annual Hawaii International Conference on System Sciences (HICSS'06)"。以下是本篇paper的摘要內容:

在商業中,針對部份客戶作目標性的廣告推薦是很有用的。傳統上都是靠手動方式分析先前的歷史交易資料或是客戶的相關特徵,但是近年來隨著技術的進展,這部份已經開始利用自動化的工具來處理了。目前推薦系統產生目標廣告的技術主要有兩大類,一類是content-based,另一類則是social-based。前者主要是比對個人特徵與產品內容分類的匹配性,缺點是沒有利用到有影響力的其它人。後者則是利用客戶對產品的評等關係之間的關連來作推薦,但是對於沒有被評等過的新產品或是尚未有評等產品的新客戶來說,這種方法並沒有用處。

為了修正上面所提方法的缺失,因此本篇paper提出一種基於social network概念的data mining framework for targeted advertising system。這種方法的原理是利用social network中的概念─如果兩個不認識的人間有另一個共同彼此認識的人,那麼他們之間的連結程度比任意兩個不認識的人之間還要強的許多。以此為基礎,找出客戶關係網路中的cohesive subgroups。接著將產品作分類,然後計算每個產品類別在對應的subgroup中交易的次數作為整個subgroup對該產品類別的愛好程度。透過這種方式,找出在某個固定的客戶數量下最有可能購買某項產品的客戶群 。對於新客戶來說,廣告推薦是根據新客戶屬於哪一個subgroup而定;對於新產品而言,則是根據新產品屬於哪一個分類。

最後作者們以彰化師範大學的教職員email logs與library-circulation data作為資料針對以下四種方法來實驗:

1. Group-based, 本篇paper所提出的方法
2. Single-based,將每個人視為一個subgroup
3. Neighbor-based,將有直接關係的人視為一個subgroup
4. Random,隨機選擇

結果顯示本篇paper所提出的group-based方法的performance是最佳的,並且在數量100-300之間具有明顯的統計顯著性。

最後是這次報告的投影片內容:

A Framework for Rapid Integration of Presentation Components

本篇paper的題目是 A Framework for Rapid Integration of Presentation Components,出處是Proceedings of the 16th international conference on World Wide Web WWW 2007,底下是我所寫的摘要部份:

UI(User Inteface)的開發在軟體開發過程中是最費時的部份之一。尤其是在合成應用程式的軟體開發中,UI的可重複利用機制的需求變得越來越明顯。基於此,本篇paper的作者們提出了一個Presentation Integration Framework。透過這個Framework,可以讓開發人員利用現成的Web Application組合出一個新的混合程式,只需要提供適當的介面定義文件(以XPIL寫成)而不需撰寫Application間通訊的底層程式碼。開發人員使用XPIL定義Web Application中要參與互動的操作與觸發此互動的事件,然後再提供用XPIL寫的Composition文件檔來定義Application間溝通的設定,像是一個Application的某個操作要觸發哪些對應的Application的操作函式等。最後這些介面定義經由Runtime Middleware來作處理,把高階的語言介面轉換成底層的程式碼運作達到自動化互動的機制。這個Framework包含以下部份:

* Component Model
以抽象的方式描述Presentation Component的定義,包含了Events、Operations、Properties and Presentation Modes。
* Composition Model
a event-based model,其包含了Event Subscriptions、Data Mappings、Additional Integration Logic and Layout Information。
* Language Presentation
作者們提出的一個declarative composition language,稱為Extensible Presentation Integration Language(XPIL)。
用來描述Component Model和Composition Model。
* Runtime Middleware
用來整合presentation component,包含了Event Automation與Component Adapters and Wrappers兩部份。

最後作者們認為:由於這樣一個framework是基於抽象的與鬆散耦和(loose-coupling)的概念,因此適用於web application與desktop application。而且經由這個framework的幫助將使得軟體開發者可以更快速並且簡單地開發合成應用程式中關於UI互動方面的外觀整合部份。

最後是這次報告的投影片內容: