soogle’s diary

soogle life log

日本語でFULLTEXT全文検索

最近少しずつ気になっている掲題の件ですが、
下にかなりまとまっていました。


http://www.tatamilab.jp/rnd/archives/000389.html
を参照

「あらかじめ文章を形態素解析にかけ、単語レベルまで分解、それらをスペース区切りのテキストとして格納しておけば、日本語でも問題なくFULLTEXTが活用できるようになります。<中略>形態素解析MeCabChasen 等のライブラリを駆使することで実現できます。」

だそうです。


またsennaについても、
「有限会社未来検索ブラジルが公開してくれている組み込み型全文検索エンジン - SennaMySQLに組み込む事で、FULLTEXTインデックスを利用せずとも、MATCH ... AGAINST 構文での日本語全文検索が使えるようになります」
と書かれています。