说明:爬虫估计很多人知道,可以自动下载一些网站上面的图片,视频,这里说下使用FileManager
和爬虫建立影音、图片库,并分享几个美女站爬虫(1024
/mm131
/91
/mmjpg
)。想看美女的可以爬来看看。至于其他学习资料网站的爬虫,可以去Github
上找找。
截图
使用教程
爬虫使用python3
+requests
库编写,在Windows
系统和Linux
系统下都可以运行,大部分Ubuntu
、Debian
都含有Python3
,直接安装最新此系统就可以了。而CentOS
需要额外安装Python3
,这里只说下CentOS 7
系统使用方法。
1、安装FileManager网盘
教程参考:利用Caddy扩展快速安装FileManager私人网盘/在线文件管理器。
2、检查Python3并升级
查看Python3
是否安装
python3 -V
如果返回-bash: python3: command not found
,就使用Python 3.6
一键脚本进行安装:
wget https://zuta.net/down/CentOS_Python3.6.sh && sh CentOS_Python3.6.sh
本脚本包含许多必需库,不会因为缺少依赖而出问题,如果不想用脚本的,也可以手动升级,教程参考:Linux CentOS升级Python 3.6版本方法。
3、安装requests库
pip3 install requests
4、创建文件夹
mkdir /usr/local/caddy/www/file/xx #用来存储文件
cd /usr/local/caddy/www/file/xx
5、下载并运行爬虫
#91视频爬虫,默认只爬精华前100页,修改while flag<=100即可更改页数。
wget https://zuta.net/down/91_spider.py && python3 91_spider.py
#1024图片爬虫
wget https://zuta.net/down/1024_spider.py && python3 1024_spider.py
#mm131图片爬虫
wget https://zuta.net/down/mm131_spider.py && python3 mm131_spider.py
#mmjpg图片爬虫
wget https://zuta.net/down/mmjpg.py && python3 mmjpg.py
#带缩略图的91视频爬虫,最后面main()为爬的页数
wget https://zuta.net/down/91_pro.py && python3 91_pro.py
如果爬电影失败,提示no requests_html
的话,还需要运行pip3 install requests_html
,然后再开始运行爬虫。
建议使用screen
后台操作,参考:使用screen来实现多任务不断线操作命令。最后进入FileManager
网盘查看即可。