首页 python正文

python关键词排名查询代码升级版

启明SEO python 2020-12-03 14:26:04 2703 0 python爬虫
import requests

from fake_useragent import UserAgent
from bs4 import BeautifulSoup

ua = UserAgent()
useragent=ua.firefox
headers={'user-agent':useragent}
pm=True
def fanye():
    guanjianci = input('需要查询的关键词:')
    pages=int(input('需要查询前几页:'))
    wangzhi=input('目标网址:')
    for i in range(pages):
        if pm==True:
            num=i*10
            url='https://www.baidu.com/s?wd='+guanjianci+'&pn='+str(num)
            chaxun(wangzhi,url,i)
        else:
            break
def chaxun(wangzhi,url,num):
    global pm
    r = requests.get(url,headers=headers)
    soup=BeautifulSoup(r.text,'lxml')
    tits=soup.find_all('h3',class_='t')
    paiming = 1
    for biaoti in tits:

        lianjie=biaoti.a['href']

        try:
            r = requests.get(lianjie, headers=headers, allow_redirects=True)
        except:
            paiming += 1
            continue
        kwww=r.url
        # print(kwww)
        tuiurl=[]

        if kwww.find('www.baidu.com')!=-1:
            tuiurl.append(kwww)
        else:
            title = biaoti.text.strip()

            if kwww.find(wangzhi)!=-1:
                # title = biaoti.text.strip()
                print(num+1,paiming,title)
                pm=False
                break
            else:
                paiming+=1

if __name__ == '__main__':
    fanye()

比如输入关键词:深圳SEO,查询前10页,目标网址www.liaojinhua.com,输出结果为:4 8 深圳SEO优化技术交流分享-启明SEO博客,表示第四页,第8位,也就是48名。

python关键词排名查询代码升级版

评论

Python好学公众号

好文推荐

实时访客入口页面出现bd_vid=标识是什么原因

实时访客入口页面出现bd_vid=标识是什么原因

最近查看百度实时访客,总是会看到入口页面会多......

有了微信视频号,但是没有发布权限,怎么开通

有了微信视频号,但是没有发布权限,怎么开通

视频号是微信在2020年1月19号开始内测的......

如何用python抓取爱企查企业信息

如何用python抓取爱企查企业信息

前段时间,经理让我去找一些企业的信息,我平常......

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

对于一般企业网站或者博客来说,对服务器的配置......

网站始终只收录一个首页,为什么

网站始终只收录一个首页,为什么

新做了两个网站,但是一直只是收录一个首页,快......

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

修改浏览指纹的方法其实也是很简单,主要使用到......