今日の非常勤。

被災した自治体の Web ページの収集がはじまっているらしい。WARP の反映っていつぐらいだろうか。別途 heritrix かなんかで収集してもいいもんだろうか。
時系列で収集されれば処理してそこから何かデータが得られたりできるんだろうけど、1次情報から2次情報に加工する際に下手なことをすると、ただの2次情報を垂れ流すだけの splog (大半のブログはそうだけど)と一緒になるから逆に2次情報から1次情報に辿りつけるような技術が本当に必要なのだと思う。
そうか、一応国会期間中か...