网站扒站必备,简单wget代码实现一键扒站

已收录   阅读次数: 2,628
2019-07-1715:07:20 1
摘要

本站长逛Acirno的博客,发现一个很神奇的代码,就是用wget代码扒站,代码很短,但是十分好用,一键扒整站,分享给大家,试一试……

分享至:
网站扒站必备,简单wget代码实现一键扒站

开篇寄语

本站长逛Acirno的博客,发现一个很神奇的代码,就是用wget代码扒站,代码很短,但是十分好用,一键扒整站,分享给大家,试一试……

技巧介绍

有时间看到别人网站的页面比较漂亮,就想给扒皮下来,学习学习。分享一个我常用网站扒皮命令wget这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。

wget加上参数之后,即可成为相当强大的下载工具。

代码:wget -r -p -np -k http://xxx.com/

  • -r:recursive(递归) specify recursive download.(指定递归下载)
  • -k:convert-links(转换链接) make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)
  • -p:page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)
  • -np:–no-parent(不追溯至父级) don’t ascend to the parent directory.

我打开xshell,连接上我的主机,用该博主的网站测试

网站扒站必备,简单wget代码实现一键扒站

等网站递归下载完毕,你会发现你当前目录会有一个im.acirno.com的目录

因为我用的是宝塔可视化系统,所以很容易找到

网站扒站必备,简单wget代码实现一键扒站

看一下里面的内容,整个网站都被扒下来了,之后打包下载到本地就可以了

网站扒站必备,简单wget代码实现一键扒站

温馨提示

如果想防止自家的网站被爬走,可以参看下面这篇文章:

  • 我的微信
  • 微信扫一扫加好友
  • weinxin
  • 我的微信公众号
  • 扫描关注公众号
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:1   其中:访客  0   博主  0

    • avatar 伯衡君 Admin

      如果不想被人扒站,可以参看这篇文章《网站扒站必备,简单wget代码实现一键扒站》,链接:https://www.luckydesigner.space/blockcopywebsite/