てきとうなメモ

本の感想とか技術メモとか

Search

SimStringメモ

SimString どうやって高速化しているのか気になったのでメモ。基本的には辞書となるキーワードリストに対して、n-gram→キーワードのID(SID)のリストのマッピングをCDB(Constant Database)に保存しておいて、そこから入力文字列のn-gramを含むSIDがいくつn-gr…

minise on mac os x

Minise: MIni Search Engine 普通にビルドするとエラーになった.malloc.hはdeprecatedらしいので. $ diff minise-0.01-old/cmdline.h minise-0.01/cmdline.h 40c40 < #include <malloc.h> --- > #include <stdlib.h></stdlib.h></malloc.h>

1キロ車で走るとGoogleの検索1000回分のCO2が排出される

ハーバード大の物理学者Alex Wissner-Grossが「Googleで2回検索するとやかんでお湯を沸かすのと同じ量のCO2が排出されるよ」と言ったのをTimesが報道したのに対して Performing two Google searches from a desktop computer can generate about the same am…

Google Accessible View

Official Google Blog: Accessible View: An ARIA for web search GoogleがGoogle側でLDRizeを実装したようなもの.元々は目の悪いの人のために使いやすいインターフェースとスコアリングを提供していたものにこれのkeyboard shortcutsを追加したみたい.j,k…

はてブの関連エントリー機能

はてなブックマークの関連エントリー機能開発、PFI さんとの合宿 - naoyaのはてなダイアリー 面白そう.PFIというのはreflexaとか作っているところ. 精度の向上。ブックマークがたくさんついているエントリーは、かなり高い精度で関連したエントリーを抽出…

Wikia Searchが面白そう

Wikia Searchがスタートしたらしい. Error 404: Page not found! - Wikianswers - Find and edit the best answers. Add your questions here. 各検索結果に以下の操作が可能 descriptionの編集 画像,リンクなどのannotationの追加 スポットライトをonにす…

bashによる検索エンジンというかgrep

http://www.ghettosearch.net/wgetしてgrepして,なかったらリンクを抽出してwgetして…の繰り返し.aboutページがユーモラスに書かれていて面白い Boolean Queries echo "$query" | tr ' ' '|' Natural Language Processing echo "$query" | sed -Ee 's/(s|i…

definr

definr - incredibly fast dictionaryincredibly fast dictionaryと書かれてあるように検索が速い辞書サービス.検索対象はWordNet2.0で,10000語ぐらいキャッシュしているので,速いよと.キーワード補完もあるみたいなんだけども,何も出てこないような.…

5W1H Search

5W1Hという観点からキーワードを検索するサービス.こういうタイプの研究はよくやられていた記憶がある.ぱっと見た感じ, Where? → 地名表現 When? → 日付表現 あたりを検索していたり Why? → 理由,由来など How? → 方法など の単語を検索しているのではな…

Ask.comリニューアル

Ask.com - What's Your Question?テキスト,画像,動画などを一度に探せるようなインターフェース.非同期で読み込みを行っているのでそんなに待たされる感じはないけど,普通の検索よりちょっと遅い.あと,一度に全部表示するインターフェースってのは本当…

Google Hot Trends

Error - Houston ChronicleGoogle Trendsの新しい機能.最近最も検索されるキーワードTop100を出力する.現在のTop10はこんな感じ 1. singer irene 2. fellini film 3. monokini designer gernreich 4. julianne hough 5. what did mill mahar say was a way…

reflexa

連想検索エンジン reflexa連想検索エンジン.「◯◯といえば××」という形式の検索を行う.wikipediaのデータを使っているらしい.基本的に名詞しか検索できないようなので,評価や動作,機能などを連想するというわけにはいかないらしい

totowa

単語の意味を大雑把に知るためのサービス.語の定義は以下のように抽出されるらしい. 語の定義をしていそうな文を探すモジュールこのモジュールは、人間が検索エンジンを使って語の定義を探す際に、人間がやりそうな行動や人間がしそうな判断を模倣できない…

百度サービス開始

百度が日本語検索サービスを開始--その実力とは? - CNET Japan ちょっと使ってみた.結構速いんだけど0.001秒とかほんとに正確なのかよくわからない.あと,UIはGoogleにそっくりだな,と.CNET Japanの例で「花見」に対して「花見沢Q太郎」がトップにでて…

WikiaとWikiseekの違いがよくわからなくなってきた

Wikiseek、コミュニティ編集による検索エンジンをローンチ | TechCrunch Japanまず,Wikiaについて. Search Wikiaによると,2004年にWikipediaのJimmy Walesが「Search Wikia」という検索エンジンのプロジェクトを立ち上げた.この検索エンジンはオープンソ…

googleが大規模日本語データを公開

Error 404 (Not Found)!!1 たしか英語のデータは少し前に公開したという話があったけども,日本語のデータも公開するかもしれないようだ.via Googleが大規模日本語データを公開するという話 - www.textfile.org

Wikiaは編集可能な検索エンジンになるらしい

Wikia Inc., the San Mateo company co-founded by Wikipedia creator Jimmy Wales, plans to challenge Google Inc. and Yahoo Inc. with a search engine that lets users edit and fine-tune its results. Wikia plans editable Web search engine - Insi…

ワイルドカード検索

Find Facts Using Advanced Search Queries ワイルドカード検索とかあったのか.いまさら気づいた.Googleは*を買収したなど日本語でもできる.

自然言語処理を用いた検索エンジン

入力した質問に対して答えを返すような検索エンジンはGoogle Q&A以外にもいろいろあるっぽい.その一つがhakiaである. The basic promise is to bring search results by meaning match - similar to the human brain's cognitive skills - rather than by …

All The Code

HugeDomains.com - AllTheCode.com is for Sale (All The Code)新しいタイプのコード検索エンジン.現在Javaのコードのみを検索できる.NewsForgeによると,ランキングの方法として他のクラスから利用されている回数の多い方を上位に表示するらしい.同じプ…

mod_estraierを入れる

ScrapBookのAutoSaveが重いので(キャッシュとは別にローカルに保存するから)なにかいい方法がないかなと思っていたのだが,hyperestraierにapacheモジュールがあって,プロクシとして文書をキャッシュして検索できることにいまさらながら気づいた.以下を参…

Wikiseek

wikiseek.comwikipediaを利用した検索エンジン.wikipediaから参照されているサイトのみを検索対象としているのでいい結果がでるよと言っている.技術系の文書とかを探すのに使えるかも.

Googleの自然文検索

Googleが自然文検索を始めたという記事を見つけた.Page Not Found - CNET Japan最近始まったというわけではなく,ここらへんを見ると2005/04ぐらいから始まっていたらしい.正式名称(ヘルプに書かれている名前が正式なのかどうかしらないけども)はGoogle Q&…

ドイツがQuaeroから手を引くらしい

Slashdot | Germany Quits EU-Based Search Engine Project元記事はこっち International Herald TribuneQuaeroはEUが主導して検索エンジンをつくろうというプロジェクト.フランスとドイツが中心となってやるという話だったようだが,ドイツが手を引いて独…

yubnub

Yubnubコマンドライン登録サービスみたいなものかな.例えば g hogeと入力すると,googleでhogeを検索する.これは http://www.google.com/search?q=%sのように登録されていて'%s'のところが展開されている.また,コマンドを作成するときにすでにあるものを…

国会図書館デジタルアーカイブポータルがおもしろそう

via 国立国会図書館の楽しい検索サービス「デジタルアーカイブポータル(ndldap)」について - 愛・蔵太の気になるメモ(homines id quod volunt credunt) PORTA統合のお知らせ 国内のデジタル情報にアクセスするためのポータル.青空文庫とかも検索できる.シ…

ScrapBookとHyper Estraier

Windows デスクトップサーチ+ScrapBookが最強過ぎるを見ていてちょっとうちのpowerbookでもやってみた.ScrapBook+AutoSaveはいいとして,macでデスクトップサーチといえばspotlightが標準でついているのだが,なんか遅いしどこがヒットしているかわからな…

tabbed search engine

http://twerq.com/検索結果をHTML上でタブで表示することができる検索エンジン.普通にブラウザでタブで表示しているとどのタブに行ったか分からなくなることがあるので,こういうのは使えるかもしれない.同時に複数の単語を別タブに表示することもでき,pe…

Code Search

GoogleがGoogle Code Searchを出したので,似たようなサービスをちょっと調べてみた. Google Code Search http://www.google.com/codesearchGoogleのコード検索サービス.言語,ライセンス,パッケージ,プロジェクトを指定して検索することができる.POSIX…

Google Synonym Search?

Google Suggestっぽい類義語検索.Googleが作ってるわけではないのだが.http://david.dotgeek.org/google/syn/