2007年3月27日 星期二

3/27(二)工作日誌

meeting完後,
將丁昭廷報的paper下載來看一下做法。
這篇在產生feature時的確是先產生feature word list。
也就是keyword list。
而keyword list中還包含了opinion word。
也就是說這篇paper是把feature word
以及opinion word放在一起考量,
也就是觀察這兩種word同時出現的pattern。
而如果只有其中一種出現的句子,
也就是他們所謂的implicit feature。
而實驗中和劉兵比較的哪一篇作法,
是劉兵的第一篇做法,
劉的做法是將pos後的句子直接丟到associate rule
algorithm來產生rule。
但內文中沒有明確的說明rule是什麼樣子。
從文章中我覺得他就是把frequent的rule直接當成feature來用。
如(item1),(item2)->(NN feature)
imply後的就是feature了。
而他有提到兩個刪除多餘rule的方法。
所以應該是unsupervised的做法。
但我要做的東西基本上目標應該是不同的,
我的重點應該是在最後算分數的動作上,
如此產生的summary會有蠻大的不同,
而不是全部都拿來當summary。

沒有留言: