2007年3月7日 星期三

3/7(三)工作日誌

今天下午再看了一下code,之後就去找承道討論。
發現原來是我的input出錯。
在input的pattern方面不應該有重複的item出現。
但我是將一個句子中的term經過POS轉換後成為我要產生rule的input。
但一個句子有時會有重複的term,如”the”這種term。
就回去看了一下paper,是我當時疏忽了。
劉兵的做法是將有重複的POS會標示1、2、3。
如POS的tag為[NN]term1 [NN]term2 -> [NN1]term1 [NN2]term2
如此就不會有重複的問題了。
雖然也可以用別的pattern來解,但是如此可以省去寫code的時間。
所以這部分應該算是解決了。

1 則留言:

Jahui 提到...

Using sequential patterns is also one of the possible solutions.
I suppose we might miss some patterns in this transactional representation. Can you think of some examples?