把Turney的論文看過一次後,
覺得他所提出的PMI algorithm應該是可行的。
所以我想就依照這個演算法來求的feature的分數。
大致上的做法如下:
首先依照prior的演算法找出frequent的feature後,
將這些feature依照同義詞,
看能不能再做分群的動作,
之後產生一個feature word list。
分群完後到意見之中找出含有feature的句子。
再依照Turney的演算法將要算分數的phrase找出,
如1.JJ 2.NN or NNS 的phrase找出,
1. 2.是表示word的序數。
用PMI algorithm算出分數來,
再依據每個feature之中的各個句子的分數來決定feature的分數。
沒有留言:
張貼留言