Google Chrome の TweetDeck を使っていると次第にCPU使用率がガンガンと上がっていく件
どうやらAVG Antir-virus Free Editionのリンクシールドが原因らしい。
こいつを設定でオフったら問題は解決した。
つか
ここのデザイン何とかしたいな…。広告されたりでなんか酷い見栄えになってる。
文字が大きくてコードを貼り付けても良さげな感じに見えるテーマはないのかしら。
クローラーを調べてみている
適当に今日ぶらぶらした感じ、そのうち続編があるかもしれないし無いかもしれない…。
- HERITRIX https://webarchive.jira.com/wiki/display/Heritrix/Heritrix
- Java
- わしが昔使ってた奴、地道に改良されて良い感じになっているっぽい
- Webから設定を変更したりいろんな箇所にフィルター設定したりできて超便利(過去の記憶より)
- Springを使うようになってflexibilityがよくなったらしい(なにがよくなったのだろう?)
- Scalabilityがよくなったっぽい、むかしはすぐにout of memoryでコケたがそんなことはないっぽい
- 独自のARC形式に保存されるのは今も変わりないっぽい
- (感想)慣れてるから使いやすいっていうのはあるけど、ここからindex作ってってやるのはやっぱり面倒くさい
- Apache Nutch http://nutch.apache.org/
-
-
- (後日追加)
- Tech. memo: NutchとMySQL
-
- joycrawler http://code.google.com/p/joycrawler/
- Hadoopで
- あんまり調べていない
- HyperEstraier http://fallabs.com/hyperestraier/
- NICT Webクローラー https://alaginrc.nict.go.jp/resources/nictmastar/software/crawler-info/crawleroutline.html
- Anemone http://anemone.rubyforge.org/
他にも素敵なものがあったら教えて下さい。
昔調べた時のリストとかどこに行ったっけな…ここに入っていない奴が今どうなったりしているんだろ。
はてなぶろーぐつくった
http://electriceel.hatenablog.com/
こちらに江ノ島で混雑を堪能した思い出を綴ったのでみな読むといい。
東京都のテニスコートのキャンセルが出たらメール通知
を1月1,000円ぐらいでサービス提供したらみんなお金払ってくれるかなあ、ぽわわ、などと妄想した。
こりゃいけるかもしれんね月10,000円ぐらい稼げればいい鯖代稼ぎにもなるなどと考えていたらすでに無料で提供している人がいてビビった。有料にしたり定員設けたりして制限かけないと自分も空きをとれなくなってしまうじゃん。
なんと無欲な人なのか、なんかおれがお金大好きに見えてしまう。
つか、でもこれって、ひょっとしてモバイルサイトをアクセス過多にしている人なんじゃないかしら…。通報、しちゃおうかな…。そうすればおれのコードが唯一無二になったりしてお金を稼げたりするかな、とちょっとゲスいことを考えたが、通報できそうなところが電話しかなく電話かけるのに大変勇気が必要なおれはなにもしないのであった。
ぶろぐ
とか言う方に移動するべきか(;´Д`)
(;´Д`)
なんか広告でるのけしたいです(;´Д`)