なぜ、検索漏れがないのですか?


WiSEで採用しているN-gram方式では、日本語に関しては1文字ずつに分解します。
例えば、「ビジネスサーチテクノロジ」という言葉は「ビ/ジ/ネ/ス/サ/ー/チ/テ/ク/ノ/ロ/ジ」と分解され、この中のどの部分でも検索することができます。
これに対して、検索漏れがあるとされる形態素解析方式では、辞書に登録された単語リストに基づき「ビジネス/サーチ/テクノロジ」と分解されます。
N-gram方式では「サーチテク」と検索した場合でも検索にヒットしますが、形態素解析で「テク」という単語が登録されていないケースでは、検索にヒットしなくなります。
このため、形態素解析では、「テク」で検索にヒットさせるために、単語の登録などの作業が必要になります。
このようなケースは、人名、地名、商品名(特にカタカナが混在するもの)などでよく発生します。


WiSE(WiSE EC、Standard、Webクローラ)


TOP