开篇寄语
本站长逛Acirno的博客,发现一个很神奇的代码,就是用wget代码扒站,代码很短,但是十分好用,一键扒整站,分享给大家,试一试……
技巧介绍
有时间看到别人网站的页面比较漂亮,就想给扒皮下来,学习学习。分享一个我常用网站扒皮命令wget这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。
wget加上参数之后,即可成为相当强大的下载工具。
代码:wget -r -p -np -k http://xxx.com/
- -r:recursive(递归) specify recursive download.(指定递归下载)
- -k:convert-links(转换链接) make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)
- -p:page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)
- -np:–no-parent(不追溯至父级) don’t ascend to the parent directory.
我打开xshell,连接上我的主机,用该博主的网站测试
等网站递归下载完毕,你会发现你当前目录会有一个im.acirno.com的目录
因为我用的是宝塔可视化系统,所以很容易找到
看一下里面的内容,整个网站都被扒下来了,之后打包下载到本地就可以了
温馨提示
如果想防止自家的网站被爬走,可以参看下面这篇文章:
ArrayArrayArray- 我的微信
- 微信扫一扫加好友
- 我的微信公众号
- 扫描关注公众号
2019-07-17 下午7:45 沙发
如果不想被人扒站,可以参看这篇文章《网站扒站必备,简单wget代码实现一键扒站》,链接:https://www.luckydesigner.space/blockcopywebsite/