#爬爬# 分享两个Tumblr爬虫脚本 | 微魔部落
Tumblr(网友戏称为"汤不热",这回倒是可能真的要凉了)最近受到各大吃瓜群众的格外关注,主要是因为要关闭一些内容,目前这件事在国外还在持续发酵,至于本身遵纪守法的我们,可能影响不大。微魔最近看到有朋友在讨论相关的爬取脚本,就顺手和大家简单分享两个脚本。
两个Tumblr图片和视频的爬虫脚本
1. tumblr-crawler
使用方法:
git clone https://github.com/dixudx/tumblr-crawler.git cd tumblr-crawler pip install requests xmltodict
修改sites.txt文件,加入想要下载的tumblr用户名,如vmvps1.tumblr.com和vmvps2.tumblr.com,直接在sites.txt文件里加入如下形式即可
vmvps1,vmvps2
运行脚本
python tumblr-photo-video-ripper.py
2. tumblr
pip install requests
pip install requests xmltodict
下载脚本,修改脚本末尾(倒数第二行)处的字段names=[],如下格式
names=['vmvps1','vmvps2']
运行脚本
python tumblr.py