pywordformpython的docx文档解析模块
pywordform是一款python模块,用于解析微软docx文档,它可以提取所有的标记和值,并将他们存储在python的字典变量中,方便调用处理。
基本用法:
> python pywordform.py sample_form.docx
field1 = "hello, world."
field2 = "hello,"
field3 = "value B"
field4 = "04-03-2012"
介绍内容来自 http://www.pulog.org/tools/2417/pywordform/
评论
tagparserPython的HTML文档解析
很多人需要提取网页的一些内容,可以利用正则表达式提取,也可以用beautifulsoap等工具.正则表达式方法速度快,缺点是不好找到匹配的正则.其他类似beautiful的工具因为要全面分析html,
tagparserPython的HTML文档解析
0
NekoPullXML 文档解析 API
NekoPull是一个XML文档解析API,它扩展了XercesNativeInterface (XNI)以提供请求解析功能。
NekoPullXML 文档解析 API
0
Go FeedreaderGo 语言的 RSS 解析模块
Feedreader是用于Go语言的RSS2.0和Atom1.0解析模块,供QReader调用。Feedreader包可以解析RSS2.0与Atom1.0标准的feed。使用方法可以看上面的例子,然后
Go FeedreaderGo 语言的 RSS 解析模块
0
goPsdLibGo 实现的解析 psd 文档库
goPsdLib是使用Go语言开发的一个解析psd文档的库,可以将psd中所有的图层保存成图片格式。目前处于开始阶段。已经完成图层解析,细节部分还在进行。
goPsdLibGo 实现的解析 psd 文档库
0