拼多多的搜刮的参数anti_content怎样破

2019年8月31日 2,099次阅读来源: sergiojune

本日继承带来破解拼多多的 anti_content 参数破解，代码已放在github上：https://github.com/SergioJune…(点击原文浏览直达)

假如对你有效的贫苦给个 star 支持下哈。

这个项目我也会延续更新，这两周暂不更新，只发文章，能够我前两周成天做这个，有点腻了，歇会。别的能够借这个文章温习下思绪，你们也能够进修下思绪，学了以后最好本身实践一遍，如许才会真正学到东西。

空话不多说，最先正文。

1.寻觅所需参数

拼多多网址为：http://yangkeduo.com/

点击搜刮，然后最先滑动下一页，你能够看到这个：

《拼多多的搜刮的参数anti_content怎样破》

这里有三个参数须要找的，其他参数都能够看得出是什么，有些也是牢固稳定的。

先从第一个参数 list_id 最先，平常都邑翻开搜刮，举行搜刮这个参数

《拼多多的搜刮的参数anti_content怎样破》

随意一找，即可找到这里

《拼多多的搜刮的参数anti_content怎样破》

这个是我们在第一次要求搜刮页返回的，也就是发送这个要求：

《拼多多的搜刮的参数anti_content怎样破》

经由历程屡次试验，这个要求只须要带上关键字参数即可要求胜利，比方如许：http://yangkeduo.com/search_r…

只是关键字须要剖析一下即可，题目不大。

在这个页面还给我们返回了 flip 这个参数，所以我们能够运用正则来猎取这两个参数，剩下的就是 anti_content 了

我们能够尝尝再和上面那样，尝尝经由历程搜刮 anti_content,能够看到，也能够经由历程搜刮看到，经由查找并屡次断点，能够找到这个为位置：

《拼多多的搜刮的参数anti_content怎样破》

打上断点，能够看到就是我们须要的数据，然则怎样找到加密的位置呢？请继承往下看。

2.寻觅加密位置

假如你纯真是想经由历程上面这类体式格局查找的话，估计会一成天都在那边按实行下一行代码，末了另有能够得不到本身想要的效果，本日通知一个很简单的要领，由于每次都是发一个要求，所以我们能够在开发者东西下打个 xhr 断点，如许在我们滑动要求的时刻就能够抓到这个要求，并检察挪用栈即可疾速找到，经由历程这个要领，最多就只须要半个小时吧(强调了不太好)。

打 xhr 断点在这里打：

《拼多多的搜刮的参数anti_content怎样破》

这里还能够依据要求的要求途径举行断点，我就不写上了，我直接捕捉任何 xhr 断点了，你能够本身尝试下，固然，除了这个 xhr 断点，另有许多断点，比方事宜监听等，这些在对反爬越发凶猛的须要用到的时刻就越多，所以，闲着没事的话能够研讨这些断点，会了能够大大进步本身的工作效率，都是爬虫必会的。

打上断点以后，我们能够举行滑动，能够看到这里：

《拼多多的搜刮的参数anti_content怎样破》

这里第一次捕捉到的是我们浏览器的设置和我们运动的间隔彷佛，这个能够直接疏忽，举行下一个断点即可。

《拼多多的搜刮的参数anti_content怎样破》

这里就能够看到我们须要找的参数了，然则这里已天生了，我们能够直接检察右侧的挪用栈

《拼多多的搜刮的参数anti_content怎样破》

经由屡次检察，能够很轻易就发明这个处所有点东西，马上下断点

《拼多多的搜刮的参数anti_content怎样破》

这时候我们能够先去掉 xhr 断点，然后刷看检察，猎取不断点下一个断点直到运转终了再滑动到下一页即可。经由调试能够看到这个：

《拼多多的搜刮的参数anti_content怎样破》

所以我们的 anti_content 参数就是从这里天生的，所以接下来就是继承检察这个语句实行的语句，再次经由屡次调试，能够发明是从这里天生的：

《拼多多的搜刮的参数anti_content怎样破》

ep(“0xd2”, “jLF%”) 等于 anti_content 的天生语句，能够继承在函数内部打上断点即可检察内部天生历程。

3.代码太多，只能应用execjs，或许运用接口

由于这里的代码太多，而且我又不太懂内里的加密历程，所以我才说这类加密一般都是只须要找到加密位置即可，接下来就是把所须要的加密 JS 代码扣下来运用 python 的 pyexecjs 来运转即可，然则假如你懂它内里的加密要领，就能够直接运用 python 供应的对应的加密要领举行运用即可，如许子就更轻易得出效果，所以接下来须要进修的处所就是种种加密要领。

这里的加密要领我猜想是经由历程 deflate 加密要领，有兴致的能够本身检察。

这里扣代码没什么好说的，说下这里的坑吧。坑有两个，

一个是须要运用到一个 cookie，不过牢固即可，无须要猎取，这个 cookie 是下面这个：

《拼多多的搜刮的参数anti_content怎样破》

运用到的处所为这里：

《拼多多的搜刮的参数anti_content怎样破》

经由历程 split 切割就是猎取上面箭头所指的 cookie，下面的函数就是举行赋值然后返回给一个对象，这里经由历程本身逐步调试都是能够晓得的。

另一个坑就是须要运用到我们的第一次的搜刮要求，有两个处所

《拼多多的搜刮的参数anti_content怎样破》

到时挪用函数传参即可。其他的就没有什么了，假如有请在留言区发问。

4.考证

我们能够运用 execjs 来实行 JS，或许运用node来实行然后供应给python 接口也是可行，看你个人，这里我直接运用 execjs 来实行了。

《拼多多的搜刮的参数anti_content怎样破》

假如你运转以后涌现编码题目的话，能够看看这篇文章：https://sergiojune.com/2019/0…

能够猎取了，终了。源码放在了我的gihub，想要的能够点击原文浏览猎取，对你有效的话记得给个 star 哈。

末了

一最先写这个每周一爆的系列是由于，我看到如今网上的爬虫文章质量广泛都很低，能应用到实际工作的并不多，所以想写一些真正有用的文章，而且能够明显进步人人爬虫程度的。不晓得人人想不想看这类文章，照样想看点基本类的文章，由于每次都异常专心写出来，原以为浏览量能够会很好，但末了都是很昏暗，在想本身是否是陷入了自嗨式写作，所以想人人给点发起，人人都想看哪类的文章。能够在下面投票下，感谢。

本文仅用于交流进修，请勿用于不法用处，后果自负！
首发链接：https://sergiojune.com/2019/0…

《拼多多的搜刮的参数anti_content怎样破》

点个赞支持下？

    原文作者：sergiojune
    原文地址: https://segmentfault.com/a/1190000018660820
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。