在采集内容时,很多时候都会遇到采集的内容中包含了元字符,如果恰巧元字符在我们需要替换的内容中,那么我们用re.sub()是无法替换掉内容的,如下面代码:
import re str2='<p>小伙伴们大家好,今天抽了个时间整理了一些好吗$「优势」,这些你肯定是有必要了解的,新手必看哈!</p>' str1='''<p>小伙伴们大家好,今天抽了个时间整理了一些好吗$「优势」,这些你肯定是有必要了解的,新手必看哈!</p><span >在互联网时代,每个企业都需要对沙发打算打发大水, 使打发大水更符合互联网运营的发展机制。然而,企业发电房暗室逢灯中存在着</span><span >整</span><span >局优化和子关键字优化。有些企业不知道应该做整体优化还是关键字优化。 因此,下面的内容将为您提供有关它们的详细信息。</span><p><strong>一、企业整站优化的优势是什么?</strong></p><p>1、排名增长很快</p> <p>有更多的关键字和用户感兴趣的信息来优化整个网站的布局,这样可以吸引更多的用户点击和访问。从而给搜索引擎留下好印象,使网站排名快速增长。</p><p>2、重量更容易提高</p> <p>企业做整体优化除了对关键词进行优化外,还要根据搜索引擎和用户对某个网站的需求进行合理的布局,使得整个网站的优化关键词布局宽、相关性高,排名和权重都会高于关键词优化。</p> <p>3、流量增加的速度很快</p><p>大多数用户根据关键字进行搜索。因此,通过网站关键词的整体布局,如果相关关键词的流量也能带动网站流量的快速增长。</p> <p>一般来说,整站优化是对一个网站的综合优化,它会对网站的每个页面进行优化,使每个页面都能参与排名。最终的目标是提高网站的整体排名&提高权重,获得大量的搜索流量,提高客户和品牌。</p> ''' str3=re.sub(str2,'',str1,re.I) print(str3)
输出结果如下:
解决方法:
使用转义字符对元字符做处理,稍作修改后,代码如下:
import re str2='<p>小伙伴们大家好,今天抽了个时间整理了一些好吗\$「优势」,这些你肯定是有必要了解的,新手必看哈!</p>' str1='''<p>小伙伴们大家好,今天抽了个时间整理了一些好吗$「优势」,这些你肯定是有必要了解的,新手必看哈!</p><span >在互联网时代,每个企业都需要对沙发打算打发大水, 使打发大水更符合互联网运营的发展机制。然而,企业发电房暗室逢灯中存在着</span><span >整</span><span >局优化和子关键字优化。有些企业不知道应该做整体优化还是关键字优化。 因此,下面的内容将为您提供有关它们的详细信息。</span><p><strong>一、企业整站优化的优势是什么?</strong></p><p>1、排名增长很快</p> <p>有更多的关键字和用户感兴趣的信息来优化整个网站的布局,这样可以吸引更多的用户点击和访问。从而给搜索引擎留下好印象,使网站排名快速增长。</p><p>2、重量更容易提高</p> <p>企业做整体优化除了对关键词进行优化外,还要根据搜索引擎和用户对某个网站的需求进行合理的布局,使得整个网站的优化关键词布局宽、相关性高,排名和权重都会高于关键词优化。</p> <p>3、流量增加的速度很快</p><p>大多数用户根据关键字进行搜索。因此,通过网站关键词的整体布局,如果相关关键词的流量也能带动网站流量的快速增长。</p> <p>一般来说,整站优化是对一个网站的综合优化,它会对网站的每个页面进行优化,使每个页面都能参与排名。最终的目标是提高网站的整体排名&提高权重,获得大量的搜索流量,提高客户和品牌。</p> ''' str3=re.sub(str2,'',str1,re.I) print(str3)
输出结果如下:
评论