2007年3月28日 星期三

3/28(三)工作日誌

今天先試試看沒有標記[feature]的item測試看看
由於一個transaction中不能有重覆的item,
所以將句子以及其POS tag分開當作item的話,
可能會有許多重覆的item產生。
如一個句子有複數的very的話,哪item就會有重覆的情形。
所以我就將一個word以及其POS tag當作一個item。
先試了一下用110個意見,共544個句子。
support訂40%,confidence訂60%。
rule就已高達數十萬條。
這樣要過濾也相當困難。
因此這兩天應該會先把要當feature的字訂出來,
然後用有包含feature的transaction去跑。
如此產生的rule應該會少掉許多,
也比較會是想要的rule。

沒有留言: