書きました。
tagベースでサーチしてダウンロードします。
https://github.com/MichinariNukazawa/pixivpy_wrapper
詳しい特長はREADME.mdにて。
ダウンロード済みのものはスキップするようにしています。
切断が起こった場合、自動リトライしません。リカバリしない方針です。
実際に、使っていると途中で切れます。
```
[114:999, 27:30] `ろーちゃん`
[114:999, 28:30] `【艦これ漫画】from bed to bed`
[114:999, 29:30] `3月`
Error: search error `艦これ`
{ 'errors': {'system': {'message': 'The access token provided is invalid.'}},
'has_error': True,
'status': 'failure'}
end: 0 2018-04-24 01:03:15
```
スキップと、スクリプトの内部変数で開始ページを指示できるので、そこの書き換えで対応してます。
(今回、スクリプトの引数をやたら増やしても使い勝手は良くならないなと思ったので、これは内部変数です。)
引いたことのないはずのページに、時折ダウンロード済みが混じります。不思議。
```
[177:899, 27:30] `ぽいぬ`
[177:899, 28:30] `イベントお疲れ様!`
[177:899, 29:30] `温泉山風`
Notice: already exist [178:899, 0:30] `温泉山風`
[178:899, 1:30] `おさんぽいぬ`
[178:899, 2:30] `鹿島(艦隊これくしょん)`
[178:899, 3:30] `武蔵さん龍田ちゃん改二!今日の鎮
```
タグが1つのときと2つ以上のときに、微妙にマッチルールを変えるifを入れてあるのですが、正直いらなかったかなと思っています。
画像と別に書き出されるJSONっぽいものはあくまでJSONっぽいものなので、読み込み時にJSONパーサに渡す前にひと手間必要です。この小ネタ、ローカルファイルをキャッシュや読み込み無しで追記するだけで良いので、ネットワーク越しに使うのでなければ結構有効なテクニックだと勝手に思っています。
0 件のコメント:
コメントを投稿