pythonで遊んでたら

なんでか知らないけど、webページの本文から画像のみを抽出してTumblrにポストするツールが出来た。
URLを入力すると自動でリストアップ、チェックの入った画像のみをポストするだけ。
これをWebサービスとして公開でもできたらいいんだけど、色々と至らないところだらけなので断念。

やってる事

受け取ったアドレスからHTMLを取得、画像のリンクを抽出、フォームから選択、投稿。

本文のみから画像を抽出する方法は、別に特別なことをしてる訳ではなくHTML::Feature 3.00 リリースしました - download_takeshi’s diaryに書いてある、LDRFullFeedのXPathのデータから切り出すかGoogleADSenceのタグに囲まれた範囲から検索してるだけの単純仕様。普通のwebページには弱いけど、大抵のblogはこれでいける(と思う)。

最初は本文抽出が書けただけで満足していたんだけども、それだけじゃあ面白くないからとTumblrにでもポストしてみようと思い、フレームワークに簡単に書けるっぽいjunoを選んでみたけど、仕組みを理解できてなければ簡単に出来上るはずも無く。webフロントエンドってのを書いたことが無いので色々苦戦したけど、結局は40行ちょい、テンプレも含めて200行程度で動いたのには感動した。

投稿はTumblrAPIを叩くだけ。queueにでも入れば一気に投稿されなくて済むんだけど、APIからの指定は出来ないみたい。