今天在QQ群里又聊起来百度快排的事情,一时忍不住就多嘴了几句。百度快排,我最早了解到这个技术是在2018年还是2019年,具体搞忘记了。刚接触这个技术的时候,认为很简单,只要懂代码编程,写一个切换IP的点击程序就可以了,认为这是一个作弊的手法,迟早会被百度干掉。可是,这一切都是我的自以为。直到2020年这还是一个非常吃香的技术,于是2020年底,我就开始学习了编程,在掌握了一些编程的基础后,就开始写点击程序,从Python的selenium,到pyppetter,再到puppetter,最后再到易语言,前后总共花了一年的时间才搞明白了快排技巧。刚搞出来的时候非常兴奋,以为有了这个技术,就不用工作了,于是辞职了,全职自己做网站去了。可是好景不长,2022年初,百度一个算法,快排技术彻底淘汰,剩下一些模拟点击还算有那么一点效果,但是也不理想,网站失去快排后,全都死了,无奈之下我不得不再去找工作。
今天,看到还有很多人再研究这个技术,想了想还是决定分享一些重要的知识出来,让大家少走一点弯路。
首先,selenium虽然很好用,但是由于功能过于强大,很多人在用,所以百度很容易就能检测出来。用它写出来的快排代码,肯定无效。所以,如果想搞快排,可以优先学习pyppetter,puppetter或者易语言。这里我建议直接用pyppetter,再用puppetter,如果是程序员出身,当然随便哪一个都可以搞,甚至三个同时搞,都没问题,因为程序员在掌握了一个程序语言后再学习其他语言,很快就会上手。
其次,百度会检测哪些要素
第一、pyppeteer自动化的特征要去除掉
第二、元素不能直接点击
第三、请求头需要变化,请求头如下
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36
请求头中有一些特征,我们一定不能使用Python自动生成的请求头,这样很容易出险一些错误,最好的方法就是在百度统计收集。
如果想要我自己写的源代码,可以关注关注公众号查看,发送“快排代码”查看