今天把related work的部份再寫了一段,
是關於opinion summarization的。
看了幾篇之前看過的文章,以及它們的related work,
這部分著實花了不少時間。
還有將chunking的ouput修正為自己想要的格式,
以做為associate rule的input,做意見之間的分割就花了一下午,
後來用regular expression完成。
之後用一些測試的檔案跑了一下,試一試產生的rule如何。
但如果把support調太低,pattern就非常的多,跑rule就會花不少時間。
測試的檔案我只有用四句話,而support為20%的話,
pattern就可以有上百個。
當然其中有很多的rule是不需要的,
這一點還要再回去看一下要怎麼去除不必要的rule。
未來這幾天應該就會在這方面做改進。
沒有留言:
張貼留言