这个txt文档每章后面都有个这个特殊字符，如何提取出来删除掉？

Python爬虫与数据挖掘

共 1309字，需浏览 3分钟

·

2022-10-15 14:15

点击上方“Python爬虫与数据挖掘”，进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

今

日

鸡

汤

林卧愁春尽，搴帷览物华。

大家好，我是Python进阶者。

一、前言

前几天在Python白银交流群【Python狗】问了一个Python正则表达式处理的问题，提问截图如下：

如果我是他的话，我会直接一步到位，使用notepad++打开文件，然后调出替换界面，全部替换即可，不需要代码实现也欧克的。不过这里使用Python的方式进行实现，一起来看看吧！

二、实现过程

这里【瑜亮老师】给了一份代码，如下所示：

import re
filename = '西游记全集（吴承恩）.txt'
with open(filename, 'r', encoding='gbk') as f:
    data = f.read()

result = re.sub(r'\#.*?\#', '', data)

with open(filename, 'w', encoding='gbk') as f2:
    f2.write(result)

代码截图：

如果仅仅是粉丝截图发的那些需要替换的话，上面的代码是完全可以满足需求的，不过后来他又新增了一个新需求。

能不能把范围扩大点把最后的这个也匹配进去？答案在下面了。

加参数，匹配换行。使用re.S参数以后，正则表达式会将这个字符串作为一个整体，将\n当做一个普通的字符加入到这个字符串中，在整体中进行匹配。

三、总结

大家好，我是Python进阶者。这篇文章主要盘点了一个Python正则表达式处理的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【Python狗】提问，感谢【瑜亮老师】给出的思路和代码解析，感谢【dcpeng】等人参与学习交流。

大家在学习过程中如果有遇到问题，欢迎随时联系我解决（我的微信：pdcfighting），应粉丝要求，我创建了一些高质量的Python付费学习交流群，欢迎大家加入我的Python学习交流群！

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐：

盘点一个网络爬虫POST请求参数构造的问题
盘点一个Python基础中循环判断遇到一个小问题
重装pycharm和Python环境以后，以前的文件selenium获取不到元素了?
不使用内置函数的情况下，如何使用Python实现求平均值、最大值和最小值？

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

浏览 44

点赞

收藏

分享

举报

评论

图片

表情

如何理解这个世界

如何跳出编程这个坑

大数据文摘

学了这个，别把轩辕供出来哦～

编程技术宇宙

英文文档读起来累？试试这个神器！

公众号程序猿DD

PeaExtractor文档提取工具

PeaExtractor 是开源项目 PeaZip 项目的附带品，可以从 150+ 文档类型 (7Z

这个痛所有文案都有！长点心吧。

如何看待广告投放这个行业？

楼上张朵朵大姐姐回答的很详细，做为资深互联网人再补充一些不同的观点。一、就行业前景来说，广告投放隶属于广告行业没毛病，广告业是任何一个经济体都需要的民用级高精尖行业。经济越发达，市场竞争越激烈，越需要广告宣传。而广告投放是广告宣传中的一个重要环节，你说他重要不重要呢？有没有前景呢？我看是不仅是有前景而且前景无限大。二、广告投放具体工作是什么。要弄清她的位置先得从广告宣传工作来拆解。广告宣传一般来说分工为：市场调查、用户洞察、宣传策略、创意制作、媒介策略及投放、效果监测及评估。你提到的广告投放指的是媒介策略及投放环节，它服从于整体宣传策略，它的核心载体是媒体，是解决广告主的信息如何传达到目标受众的途径。这个路径可能花钱也可能不

PeaExtractor文档提取工具

PeaExtractor是开源项目PeaZip项目的附带品，可以从150+文档类型(7Z,ACE,BZ2,CAB,GZ,ISO,RAR,TAR,ZIP等等)提取内容，是个简单直接的提取工具。PeaEx

怎么把这个txt里面的冒号前和冒号后的内容给匹配出来？

点击上方“Python共享之家”，进行关注回复“资源”即可获赠Python学习资料今日鸡汤武帝祠前云欲散，仙人掌上雨初晴。大家好，我是皮皮。一、前言国庆期间在Python白银交流群【空翼】问了一个Pandas处理的问题，提问截图如下：二、实现过程这里【此类生物】给了一个思路，需要在正则表达式代码后面

怎么把这个txt里面的冒号前和冒号后的内容给匹配出来？

点赞

收藏

分享

举报