2007年4月11日 星期三

4/11(三)工作日誌

今天將產生pattern的演算法做了更改後,
由於可以控制產生pattern的長度。
使得效率大幅增加。
將support設到1%,在兩千多個transaction中,
也只需要1秒的時間,
而且也跑出了相當多的關鍵字,
我應該會跟劉兵一樣只取出noun或noun phrase,
之後再用opinion word將infrequent的feature取出,
如此一來,效果應該是也還可以,
這幾天就要快點將正確答案標出,來確認效果如何。

沒有留言: