FrogGNOME 文本提取工具
Frog 是GNOME 的直观文本提取工具 (OCR),可从几乎任何来源抓取图像并获取文本:youtube、截屏视频、PDF、网页、照片等。
构建
建议使用 Builder 来开发应用程序。要构建该应用程序,只需在 Builder 中打开项目文件夹并按“执行”(F5)。它将下载需求并构建应用程序。
评论
textractPython 文本提取库
textract是一个Python库,用来从各种文档中提取文本信息。示例代码:# some python fileimport textracttext = textract.process("pat
textractPython 文本提取库
0
Textractorx86/x64 文本提取器
Textractor (曾用名:NextHooker)是一个基于 ITHVNR,为Windows/Wine开发的开源x86/x64文本提取器。下载Textractor的发行版可以在这里找到.老版ITH
Textractorx86/x64 文本提取器
0
PHTXHTML表格提取工具
PHTX(Peter'sHTMLTableeXtractor)是一个小的Unix命令工具用来从HTML文件中抽取表格数据并存放到CSV格式文件。
PHTXHTML表格提取工具
0
HtmlSuckerHTML 正文提取工具
HtmlSucker是一个用来从一个网页中提取文章信息的小工具包,例如从网页中提取文章标题、作者、发布时间、封面图以及文章正文内容。基于 jsoup 库进行HTML解析。HtmlSucker提取文章正
HtmlSuckerHTML 正文提取工具
0