robotstxtrobots.txt 解析器
谷歌开源的 robots.txt 解析器。
Google 称过去 25 年 Robots Exclusion Protocol (REP)协议一直是一种约定的标准,给网站管理员人员和爬虫工具开发者带来了很多不确定性。Google 现在宣布它将率先致力于让 REP 成为一个行业标准,作为这个努力的一部分,它开源了自己使用的 robots.txt 解析器,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证。robots.txt 解析器是一个 C++ 库,用于解析和匹配 robots.txt 文件中的规则,它已经有约 20 年历史了,包含了 1990 年代写的代码。
评论
TouchJSONJSON 解析器
TouchJSON是Objective-C的JSON解析器,支持OS X和 iOS设备。基于JonathanWight的CocoaJSON http://toxicsoftware.com/cocoa
TouchJSONJSON 解析器
0
HtmlAgilityPackhtml解析器
HtmlAgilityPack是CodePlex上的一个开源项目。它提供了标准的DOMAPI和XPath导航--即使HTML不是适当的格式!示例代码:HtmlDocumentdoc=newHtmlDo
HtmlAgilityPackhtml解析器
0
PC-BASICGW-BASIC 解析器
PC-BASIC是一个GW-BASIC文件解析器,可以运行和转换ASCII,字节码和“protected”(加密)的.BAS文件。它继承了MicrosoftBinaryFormat(MBF)的浮点算法
PC-BASICGW-BASIC 解析器
0
pyPEGPEG解析器
pyPEG是一个快速、简单的Python的PEG解析器。输出结果是Python的数据结构、或者是XML。PEG意思是ParsingExpressionGrammar,有点类似正则表达式.
pyPEGPEG解析器
0
JisonJavaScript解析器
JavaScript解析器,Coffee就是使用Jison解析的。Jison将一个上下文无关语法作为输入,输出对应的JavaScript代码,类似Yacc。
JisonJavaScript解析器
0