火车头采集小说教程规则需要注意的内容,可采集,一次搞了几百部! -世界杯365买球

seo工具 11-10 14:27:00


最近在采集小说,小说站相对来说比较好采,也有几个需要注意的地方:


1、充会员,拿cookie


要充到会员拿cookie才可以采集,要不然没有浏览权限。

火车头小说采集.png

2、小说站类型


有的小说站是微信公众号 微站的形式,需要手机抓包,相对网页站来说,麻烦一些,网页站点采集相对容易些,但是也有限制,比如,找不到内容放哪里去了,站长做防采集隐藏了起来。


3、外链 很烦


有的小说站在文章中嵌入了很多外链,格式样式不同,量非常大,让人很头疼。


4、站点序号


这一点不同需求的人不同,采集小说上传到自己的小说站,需要采集到的文章小说有一定的规则,也就是按照序号排列,很多站点把序号故意整乱,格式乱七八糟,在匹配这些序号时,浪费了大量的时间。还不能做到,百分百匹配正确,2000千章的小说,总有那么一些匹配不正确的。


作者qq129-0654-348

------------------------20181208更新------------------------


注意:

5、火车头采集小说时,请先说明采集模板样式,有童鞋,直接过来采集规则,然后后面需要根据模板再进行修改,会麻烦些,单本采集和全本采集的规则是不同的哦~


6、全本采集,有的小说站点在章节中没有小说名,如果需要从一级网址或者二级网址采集数据,需要火车头的会员版才行,免费版不能使用。


7、采集时如果cookie 失效,还需要我们学会抓包。


=====20191109更新=====

8、关于教程问题:


8.1、采集pc端的小说,根据就可以解决,尤其是那些免费采集的pc端小说站点,比如:笔-趣、阁 ==八 一 中 文))网。

8.2、采集微信公众号小说教程比较麻烦,因为公众号的不稳定性,公众号会失效,可能需要重新制作教程,我这边也联系了一些做小说站的朋友,很少愿意公开分享,所以,可能还需要再等待一段时间。


=====20191123更新=====

9、关于get和post的列表页


昨天有个朋友需要采集的站点,是微信公众号的小说站,该站点会提前get出前15章,后面的全部是post请求,该朋友测试的时候,老是发现缺少了前15章,后面我仔细查看之后发现列表页get的数据没有获取到。

因为标签规则都是一样的,所以,直接把前15章的那个列表页网址复制到火车头的初始地址里面,就可以获取到了。

=====20200420更新=====

10、火车头小说采集视频教程

点击这里购买 店铺链接失效,暂停出售

=====20201130更新=====


承接:火车头小说规则定制,pc站、微信公众号站点均可采集。网页右上角点击联系我