2007年5月24日 星期四

5/24(四)工作日誌

下午和學長討論了一些用wordnet來對同義詞作分群,
討論的結果是如果把所有抓到的feature都拿來作分群的話,
效果應該會不太好。
應該先挑出一些關鍵常出現的feature,
然後根據這些feature來找同義字,
再看找到的feature中有沒有這些同義字,
再來進一步做分群的動作。
而今天發現wordnet中可以將查詢同義字的結果存成檔案,
如此一來我可以先挑出要找同義字的關鍵feature,
如room、clerk等...
然後將這些關鍵feature的同義字檔案拿來當作分群的依據,
如此我就不用直接連結wordnet的API,
也省去許多麻煩。
而也能得到一樣的效果。
所以之後應該就會看看要挑出哪些關鍵feature的分群效果會較好

沒有留言: