mixi のトピの画像を根こそぎ落とし隊…
…と、思っていつもの如くバータリーにやってみたら出来たのでメモ。見ての通り wget と ruby が必要。
まず、
wget -O - --keep-session-cookies --save-cookies=cookie.txt http://mixi.jp/login.pl --post-data="next_url=%2Fhome.pl&email=メールアドレス&password=パスワード"
…みたくやって、ログインした時に貰える cookie を cookie.txt というファイルに保存する。
メールアドレスとパスワードは、当然ながら普段 mixi へのログインに使用しているモノ。きっと url-encode するのが吉。
あとは、上で保存した cookie.txt があるディレクトリで、下記のスクリプトの標準入力に、欲しい画像がある mixi のページの html ソースを喰わせる。
#!/usr/bin/ruby
IMGREGEXP1 = /MM_openBrWindow\('([^']+)/
IMGREGEXP2 = /<img SRC="([^"]+)"/
STDIN.each { |line|
if line =~ IMGREGEXP1
command = "wget -O - --load-cookies=cookie.txt http://mixi.jp/#{Regexp.last_match(1)}"
command.gsub!(/\&/, "\\\\&")
command.gsub!(/\?/, "\\\\?")
html = `#{command}`
if html =~ IMGREGEXP2
`wget --load-cookies=cookie.txt #{Regexp.last_match(1)}`
end
end
}
…と、取り敢えず、数日前はコレで画像が取得できたっぽい。
エラー処理とか何もやってないし、ダメだった時は自分で解決して下さい。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- AmigaOSのHDDジオメトリ (つづき)(2017.05.29)
- AmigaOSのHDDジオメトリ (つづく…)(2017.05.23)
- Firefox41 で .keysnail.js がエラーしてた件(2015.10.12)
「スクリプティング」カテゴリの記事
- Android の adb backup から一部だけリストアしちゃー(2014.08.22)
- Python の正規表現が激遅だと思ったら(2013.05.27)
- Pythonの日本語版HTMLヘルプ再構築(2013.03.07)
- migemo の ruby 1.9 対応 (NTEmacs + Cygwin)(2012.10.30)
この記事へのコメントは終了しました。


コメント