てきとうなメモ

本の感想とか技術メモとか

2011-03-01から1ヶ月間の記事一覧

SimStringメモ

SimString どうやって高速化しているのか気になったのでメモ。基本的には辞書となるキーワードリストに対して、n-gram→キーワードのID(SID)のリストのマッピングをCDB(Constant Database)に保存しておいて、そこから入力文字列のn-gramを含むSIDがいくつn-gr…