ScrapBookのAutoSaveが重いので(キャッシュとは別にローカルに保存するから)なにかいい方法がないかなと思っていたのだが,hyperestraierにapacheモジュールがあって,プロクシとして文書をキャッシュして検索できることにいまさらながら気づいた.
以下を参考にしてインストール.
ほぼ上の記事のままでインストールできた.
これがautosaveに比べていいところはフィルタリングがいろいろできることだ.フィルタリングには以下のような方法がある
- EstraierAllowURI, EstraierDenyURI ... URIを正規表現でマッチさせる.例えば検索エンジンの検索結果などは保存しないようにできる
- EstraierDenyRequestHeader ... Http Request Headerを正規表現でマッチさせる.例えば,認証のいるページなどを除外できる.
- EstraierDenyResponseHeader ... Http Response Headerを正規表現でマッチさせる.これの使い方は,Content-typeで除外するとか,言語で除外するとかかなあ.Content-typeはEstraierFilterCommandの方が使えそうだが.
- EstraierFilterCommand ... doc, xls, ppt, pdfなどのファイルに対して外部コマンドを用いてhyperestraierの登録形式に変換するフィルタを設定できる.