2004年08月18日

ブログ検索サービス「blogWatcher」

先日、新たなブログ検索サービス「blogWatcher」が開始された。

ネタ元:Broadband Watch

入力したキーワードに関する評判や登場頻度、注目度などをブログサービス以外のサイトも含めて検索できる。現在は約200万エントリのブログを収集しており、今後は500万エントリまで拡大される予定。
 blogWatcherは、2003年度のIPA未踏ソフトウェア創造プロジェクト「blogページの自動収集と監視に基づくテキストマイニング」によって開発されたもの。HTML文書の構造解析を行なうことでサイトがブログかどうかを判定、RSSやPingなどのメタデータを配信していない日記サービスや、数年前に作成されたサイトなども含めた網羅的な検索が可能だという。
 blogWatcherでは期間や時期、被リンク数などを対象としてブログをキーワード検索できる。またキーワードに関する注目度「バースト度」を分析・グラフ表示することで、キーワードの注目時期や期間などを示すこともできる。また、月ごとの注目キーワード表示機能も用意されている。
 入力したキーワードに関する評判情報を抜き出して表示する機能もサポート。検索結果は評価に関するコメント部分を「ポジティブ」「ネガティブ」「どちらの場合もあり」といったカテゴリで色分け表示する。検索したキーワードに関する最新エントリのRSSフィードも用意されている。

早速試してみたが、未来検索Feedbackよりは、Technoratiに近い。
ただ、Indexされているサイト数が少なく鮮度が悪いのと、結果がイマイチ・・・かな?

通常の検索で、ソート順を「クエリとの類似度」、「新しいものから」、「古いものから」、「含んでいるリンク数」、「被リンク数」、「更新頻度」と6つから選べるのは良いかも知れない。
また、検索結果表示時に「トピックワード」で関連語句から検索出来るのは一般ユーザーにはウケそう。この「トピックワード」は恐らくテキストマイニングで類似語句(関連度の高いものからTop30)を抽出したもの。
「バースト度(人気度)」、「評判情報(ポジティブvsネガティブ)」も新たな試みで、今後が楽しみ。

個人的には大注目しているBLOG/NEWS/RSS Search。
実は、先日のSES(Search Engine Strategies)でDanny SullivanがModerateした締めのセッションが「Web Feeds, Blogs & Search」でした。
(SpeakerはBloglines社、Feedster社、Yahoo!のJeremy ZawodnyMy Yahoo! RSS Betaの開発者、など)

この分野、近い内にサーチ業界を揺るがす可能性大では?