2013-01-01から1年間の記事一覧

Flickr の Set に入っている写真をまるっと Embed Code で取り出す

っていうのを作った。 おれのぶろーぐ用であるがせっかくなんで公開してみた。 かなりてきとーなのでノークレーム・ノーリターンな上に下記注意。 取得できるのは500個の写真まで、それ以上ある Sets はしらない、Flickr APIのせい(ってことにしておく) 画…

その後

そういえば bin/nutch clawl だとまともに動かないけど一つ一つ手順を手動で実行すると動くっぽい。どこかにスクリプトがおかしいというかもうすでにこのスクリプトを使うことは想定してないんじゃないかみたいな記述を読んだけどマシンが強制終了してどっか…

続き

HBase は問題なく動いているっぽいので nutch を設定して ant して bin/nutch clawl したが org.apache.avro.util.Utf8. で NullPointerException がでて動かない。 なにこれ。

続き

~/.m2/repository/asm/asm/3.1/asm-3.1.jar の zip が開けないというエラーっぽい maven が 301 に対応できていないっぽい -> 覚え書き: asm-3.1.jar; error in opening zip file 手動で asm-3.1.jar をダウンロードして所定のところへ The Central Reposito…

Nutch2.2 を使いたい

Nutch2.2 を mysql で動かそうと思うが動かない -> Re: Nutch 2.2 - Exception in thread 'main' [org.apache.gora.sql.store.SqlStore] 仕方ないので HBase いれるか… Nutch の GORA が 0.90.x にしか対応してないと書いてある 新しいのしかビルド済みのも…

その後

いけたと思ったけどダメっぽい。前よりましになったようなのは気のせいかな…。 どなたか情報をお寄せください。

Google Chrome の TweetDeck を使っていると次第にCPU使用率がガンガンと上がっていく件

どうやらAVG Antir-virus Free Editionのリンクシールドが原因らしい。 こいつを設定でオフったら問題は解決した。

つか

ここのデザイン何とかしたいな…。広告されたりでなんか酷い見栄えになってる。 文字が大きくてコードを貼り付けても良さげな感じに見えるテーマはないのかしら。

クローラーを調べてみている

適当に今日ぶらぶらした感じ、そのうち続編があるかもしれないし無いかもしれない…。 HERITRIX https://webarchive.jira.com/wiki/display/Heritrix/Heritrix Java わしが昔使ってた奴、地道に改良されて良い感じになっているっぽい Webから設定を変更したり…

はてなぶろーぐつくった

http://electriceel.hatenablog.com/ こちらに江ノ島で混雑を堪能した思い出を綴ったのでみな読むといい。

東京都のテニスコートのキャンセルが出たらメール通知

を1月1,000円ぐらいでサービス提供したらみんなお金払ってくれるかなあ、ぽわわ、などと妄想した。 こりゃいけるかもしれんね月10,000円ぐらい稼げればいい鯖代稼ぎにもなるなどと考えていたらすでに無料で提供している人がいてビビった。有料にしたり定員設…

ぶろぐ

とか言う方に移動するべきか(;´Д`)

(;´Д`)

なんか広告でるのけしたいです(;´Д`)

2年以上放置した(`Д´)

色々ありすぎたのであえて何も書きませんが(;´Д`)