首页 python正文

python如何写一个zblog采集程序

启明SEO python 2021-03-28 11:46:41 2349 0 zblog采集程序

最近写了一段代码,实现了采集文章后自动上传到博客的脚步,之前也想过要搞一个,当时思路是通过数据库,将采集的内容更新到数据库里。当然,这样是可以实现的。之后又有了一个思路,就是避开数据库,直接后台操作。搞了一段时间,一直找不到一个重要的参数,最近几天终于找到了,于是就有了以下的一段代码,现在分享出来:

import requests
import json
from hashlib import md5
from bs4 import BeautifulSoup
from lxml import etree
import re
def denglu():

    post_url='https://liaojinhua.com/zb_system/cmd.php?act=verify'

    session = requests.session()
    headers={
             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'
             }
    s = md5()
    s.update(密码.encode())
    daf=s.hexdigest()

    data = {
        # "btnPost": "登录",
        "username": 用户名,
        "password": s.hexdigest(),
        # "savedate": "1"
    }
    session.post(url=post_url, data=data, headers=headers)


    return session



def shuru(title,biaoqian,zhengwen):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'
    }
    get_url = 'https://liaojinhua.com/zb_system/admin/index.php?act=ArticleMng'
    session=denglu()
    html = session.get(url=get_url)
    ace = etree.HTML(html.text)
    wenzhang = ace.xpath('//div[@class="divHeader"]/text()')
    print(wenzhang)
    lianjian = ace.xpath('//div[@id="divMain2"]/table//tr[2]/td[@class="td10 tdCenter"]/a/@href')

    soup = BeautifulSoup(html.text, 'lxml')

    IDS = soup.find_all('td', class_='td5')
    print(IDS[0].text)
    ids = int(IDS[0].text)
    ids+=1
    url = re.sub('Del&id=\d+', 'Pst', lianjian[1])
    print(url)

    data = {
        # 设置文章的ID
        'ID':ids,
        'Type': '0',
        #设置标题
        'Title': title,
        # 'Content': '<p>23232<br/></p>',
        # 'meta_jiage': None,
        # 'meta_shuoming': None,
        # 'meta_lianjie': None,
        # 'Alias': None,
        # 设置标签
        'Tag': biaoqian,
        # 'Intro': 'None',
        # 设置文章上传分类
        'CateID': '16',
        'Status': '0',
        # 设置文章使用模板
        'Template': 'single',
        # 作者ID
        'AuthorID': '1',
        # 'PostTime': '2020-12-15 21:12:49',时间可以不设置
        # 设置文章是否置顶
        'IsTop': '0',
        'IsLock': '0',
        # 摘要设置
        # 'Intro':'None',
        # 内容设置
        'Content': zhengwen}
    try:
        res = session.post(url, data=data, headers=headers)
    except Exception as f:
        print(f)


评论

Python好学公众号

好文推荐

实时访客入口页面出现bd_vid=标识是什么原因

实时访客入口页面出现bd_vid=标识是什么原因

最近查看百度实时访客,总是会看到入口页面会多......

有了微信视频号,但是没有发布权限,怎么开通

有了微信视频号,但是没有发布权限,怎么开通

视频号是微信在2020年1月19号开始内测的......

如何用python抓取爱企查企业信息

如何用python抓取爱企查企业信息

前段时间,经理让我去找一些企业的信息,我平常......

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

对于一般企业网站或者博客来说,对服务器的配置......

网站始终只收录一个首页,为什么

网站始终只收录一个首页,为什么

新做了两个网站,但是一直只是收录一个首页,快......

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

修改浏览指纹的方法其实也是很简单,主要使用到......