火车头采集时网址有两个参数变化怎么办?(已解决) -世界杯365买球
火车头采集时列表页有两个参数在变如:http://www.***.com/参数/参数,两个参数规则变化还好,如果是这样:
https://www.***.com/women-sneakers-athletic-shoes-page9/ck_xarc81whaaqhiagmbahg.zso?p=8
分析:https://www.***.com/分类特征1-page9/ck_分类特征2?p=8
网站url分类不同,分类特征1和2不同,同一个分类下变化的是page和p后面的字符串,这样的情况下,要把两个分开:
https://www.***.com/分类特征1-page9
/ck_分类特征2?p=8
上面两者分别放到表格中,拖拽-数字递增,然后复制出来即可。
一个网站一般有非常多的目录,先把目录统计出来,然后把网址分开,将分开的内容放到表格,拖拽-拼接成url。
将拼接的url放在记事本中,直接用火车头调用。
该方法适合比较单一的变化。
世界杯365买球的版权声明:如无特殊标注,文章均为本站原创,转载时请以链接形式注明文章出处。