[mixi] RSS検索エンジン作ってます

今日は濃い目の話題。 まだ他言無用でお願いします(^^;

RSSをWeb上で検索できる仕組みを個人的に作ってるのですが、ベースの部分ができあがってきました。

↓"古畑" で検索したところ
http://rss.suki2.jp/search?q=%B8%C5%C8%AA
 ※「個別RSS」の機能はただいま開発中。
  デザインとかまだ入れてないので質素です。

1時間に1回ほど、手作業でリストアップしたニュースサイトやブログを巡回してDBに登録してまわります。表示順は、ページの作成日が新しい物ほど上に来ます。TVドラマが終わった後とかに検索すると、他の人の感想がすぐさま読めて面白いです。何かを探すと言うよりは風潮とかをつかむのに活躍するかも。

データに衝撃的な不整合が見つかったので、本日すべてのデータを消しちゃいましたが、再収集を開始して、ただいま3万件ほどたまってます。20万件まではメモリにためなくても普通に検索できました。すごいね、MySQL。データのインポートもOracleみたいに定義ファイルがいらないのでかなり楽チン。ただ、1日2万件程度たまるので1ヵ月で60万件、2ヵ月で120万件になってしまいます。うーん、月末にはそこらへんの仕組みも作らなきゃなぁ。

そのうちブログの方にも書きますが、mixiの方に先行公開というわけです。バグを見つけたら教えてね。