2015年9月27日日曜日

形態素解析器のいらないキーワード抽出ツール(3)

今日も昨日に引き続き、キーワード抽出ツールを作りました。

前回、「機種依存文字」によって解析が止まると書きましたが、
それは間違いで、正しくは、「特殊文字」でした。
今回のソースコードでは特殊文字は削除します。

あとはアルゴリズムをいじって精度が少し上がりました。
頑張ってベクター様での公開を目指します。


0 件のコメント:

コメントを投稿