Windows用クローラー

PHPのソースは、bamcompileを通せばWindowsで動いたりするのですが、
PHP4系の関数しか使えず、PHP5の便利関数(streamget_contentsとか)が使えなくて結構不便です。

まぁ、大したことではないので、その辺りはサクッと対処してWindows用クローラーをでっち上げてみた。
設定ファイルを読み込んで、リストされている板からスレッドを全部ダウンロードする方式。
つまり、ぶっこぬき方式で、あまりサーバーには優しくない。

試しにキー局の実況板とニュース速報VIP、ニュース速報で回してみたところ、
取得を始めたのが7時46分で終わったのが8時19分とかなり時間が掛かった。

取得したスレッド数は、合計1,285スレッドで47.3MBなので、1スレッド辺り1.54秒ぐらい。
それほど遅いって言うわけでもないけど、1回の巡回が33分ってのは良くないなぁ。
実況板だけに絞ればそれなりに回ってくれそうだし、大晦日の本番に備えてここらは調整してみよう。

ちなみに、このバイナリはそのうち配布するかも。

フォローする