selenium可以模拟浏览器进行点击,但是如果同一IP操作过多,就会出现排斥,从而抓取不到数据。所以,学会使用代理IP是使用selenium的重要一个知识点,下面我就来给大家分享下如何使用代理IP启动google浏览器。下面是代码:
from selenium import webdriver from selenium.webdriver import ChromeOptions import time import random option = ChromeOptions() ips=['http://139.209.226.129:4524','http://218.5.229.157:4563','http://117.69.144.247:4570','http://114.103.105.224:4570','http://117.69.129.82:4548'] for ip in ips: option.add_argument(('--proxy-server=' + ip))#有的博客写的是'--proxy-server=http://',就目前我的电脑来看的话需要把http://去掉就可以用,他会自己加的 driver = webdriver.Chrome(options=option) i=random.randint(3,8) try: driver.get('http://www.liaojinhua.com') time.sleep(i) driver.delete_all_cookies() driver.quit() except: print("不能使用") driver.delete_all_cookies() driver.quit()
代码没有写全,主要就是为了展现一下代理IP的使用。如有不懂的,或者是想一起学习的可以搜索微信号:qimingseo
评论