2007年4月12日 星期四

4/12(四)工作日誌

今天主要都是在做標記答案的工作,
由於意見還不少,
所以花了不少的時間,到目前大概標了一半左右,
但在標答案的過程中,也要每一句都要看過,
所以也發現其實大部分是feature的字也都有抓出來,
所以precision和recall應該不會是很低的結果。
還有最後算分數的結果,
我是想要從含有feature的句子中,
找到opinion word/phrase,
先稱之為opinion set,
再把這個set中每一個item帶進PMI的式子計算,
得出所有item的分數後,
把最高減最低得到範圍的區間,
再除以五得到五等份。
如此落在哪一等份的分數就是幾顆星。
這樣就是我目前最後算出評價的方法。

沒有留言: