对于那些采集网站优化的合理化建议

已收录   阅读次数: 725
2021-09-0720:16:18 发表评论
摘要

最近,伯衡君看到有不少采集站在采集本站内容,伯衡君甚是无奈,也了解到他们那些采集站为了流量赚钱不择手段,人之常情,无可厚非,不过,说实话,这样操作以后对网站的未来发展可能不是很好,所以能够原创就坚持原创,不能够原创也尽量在转载其他文章的时候附上署名,也是一个不错的原则哦,好人做到底,伯衡君就来聊聊那些采集站该如何进行SEO优化,防止被搜索引擎降权……

分享至:
对于那些采集网站优化的合理化建议

开篇寄语

最近,伯衡君看到有不少采集站在采集本站内容,伯衡君甚是无奈,也了解到他们那些采集站为了流量赚钱不择手段,人之常情,无可厚非,不过,说实话,这样操作以后对网站的未来发展可能不是很好,所以能够原创就坚持原创,不能够原创也尽量在转载其他文章的时候附上署名,也是一个不错的原则哦,好人做到底,伯衡君就来聊聊那些采集站该如何进行SEO优化,防止被搜索引擎降权。

内容详情

首先要明白,搜索引擎喜欢爬取的是发布及时,原创性高,网民喜欢阅读量大的文章排在前列,被搜索引擎的爬虫光顾的频次高了,网站的排名自然也就上去了。

先来聊聊最重要的吧,也就是原创和伪原创

根据过往经验,伪原创(这里指用工具伪原创)最好一点都不要做,现在搜索引擎的ai很强大,只要发现不符合正常人理解的伪原创内容,你的网站肯定会被降权的。

尤其是对标题非常强调原创性的内容,所以如果采集后的文章,一定要记得将标题修改,而且是进行大修,改的他妈都不认识他了。

而title,keywords,description这三个,根据我自己测试,没有keywords同样收录很好。title必须与你的h1标签对应的标题一致,至少大体上是一致才行。而description,需要与文章第一段一致。

所以如果是采集站,文章第一段就是搜索引擎判断是否为原创的关键内容。至于如何构造出来是你自己去分析了。

接着是网站权重问题

每个搜索引擎肯定都有自己的权重算法,第三方的权重都是根据他们自己抓取到的关键词,然后模拟查询看你的排名位置来计算权重的。

但是搜索引擎的权重算法肯定比第三方全面,每个关键词都有权重的。如果是自己的站点,当然可以看统计报表来判断,我一个aizhan权重1的站点流量却非常高,原因是第三方站点没有把用户搜索的关键词抓取到,导致无法统计权重而已。

那么该如何查看自己网站的排名呢?

根据过往经验,site:一个域名,如果看到索引几十万,但搜索列表却空空如也。那基本上就是被搜索引擎降权了。比如www.hostloc.com已经被降权。而hostloc.com却还算正常。这是第一步。第二步就是随便拷贝你看到的site:出来的标题,直接去搜索引擎搜索,如果能看到,起码前10页能看到,就说明这个站点流量还是有的。

根据以上经验来推测如何提高排名呢?

刷排名是有用的,其实就是强行刷一个关键词,模拟用户点击逐步在搜索引擎建立搜索量,然后如果这个关键词热度达到一定级别,就会在搜索引擎下拉框出现了,很多第三方查权重的关键词库都来自于搜索引擎下拉框这些热词的。所以你就会看到这些站点在第三方查出来权重都非常高。

但是:其实都是假象,搜索引擎肯定也有监控用户行为的算法,如果刷太多,被搜索引擎算法识别,会把你的网站降权。而且,这个关键词是刷的,如果停止刷了,基本上立马掉权重,因为根本没有多少真实用户会搜索这个关键词。所以如果是网站交易,特别注意这个站点是否是刷出来的。

域名的重要性

确实老域名与新域名来比优势是有的,但是老域名是指曾经建立过站点的域名,不是注册年限多久的域名。因为搜索引擎发现这个域名无法访问,只会取消索引,其实内部数据库是有信息的。

新域名:搜索引擎确实有沙盒,上面说的老域名如果再次建站,由于早已经通过沙盒,所以基本上你建立的站点很快就会被收录。而新域名肯定需要通过沙盒期才算被搜索引擎正式认为是可靠的数据来源。其实各家搜索引擎虽然没有明说。

所以:如果在沙盒期的域名,或者评级非常低的域名,一定要真实的原创内容,才会大概率通过沙盒评级。如果一开始就采集,基本上你采集5年都一个样子了。

当然,有些内容肯定不适合原创的,比如小说站。你怎么原创呢?都是一个作者写的……所以小说站的玩法根本就跟上面一切概念无关了。小说站其实竞争非常激烈,内容页根本一点伪原创都没办法做到……所以很多站点都是在列表页做文章。小说站的列表页可以构造一些冷门一点的搜索习惯长尾词,只要搜索引擎收录,还是有一定机会流量起来的。

但是:真实的竞争其实不是这样……小说站由于有版权问题,所以基本上都是一些老站看时间差不多了,直接全站301重定向到新的域名站点。这样被301重定向的新域名,会很快接替老域名权重的。所以你会发现经常排名靠前的小说站都是莫名其妙的新域名。至于你也想301就别想了,除了用黑客手段以外……其实这些老站长不可能让你动了他的奶酪的。这也是站长圈很苦逼的地方……权重代表一个站长的级别,你级别太低,人家根本理都不会理你……

再来聊聊有关采集

靠火车头等无脑采集应用的基本都是真正的垃圾站。真正有流量的站点,不管他是不是采集的,基本上都有自己的爬虫系统。所以建议多学点爬虫技术,自己弄,并不难。关键是数据来源问题了。这算是商业保密了,任何能通过网站赚钱的站长,都不可能发布出来的。

所以你看到的seo教程也好,采集源码也好,站群系统也好,只要愿意在网上发布的,都是已经被玩烂了的东西了。不要抱太大希望。

温馨提示

所以说,网站的建设以及优化一定要有较强的技术能力,同时也要学会如何经营网站,以上内容对于那些采集站来说既是建议也是警醒,坚持原创性是十分重要的。

至于如何制作自己的爬虫,可以先学习一下编程,以及一些爬虫知识,伯衡君就刚好写过几篇类似内容,可以参看:

 

 

  • 我的微信
  • 微信扫一扫加好友
  • weinxin
  • 我的微信公众号
  • 扫描关注公众号
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: