SmallGFW基于DFA的敏感词检测和替换模块
smallgfw: 一个基于DFA的敏感词检测和替换模块,用法如doctest所示。
>>> gfw = GFW()
>>> gfw.set(["sexy","girl","love","shit"])#设置敏感词列表
>>> s = gfw.replace("shit!,Cherry is a sexy girl. She loves python.","*")
>>> print s
*!,Cherry is a * *. She *s python. #屏蔽后的效果
>>> gfw = GFW()
>>> gfw.set(["abd","defz","bcz"])
>>> print gfw.check("xabdabczabdxaadefz") #检测敏感词的出现位置
[(1, 3, 'abd'), (5, 3, 'bcz'), (8, 3, 'abd'), (14, 4, 'defz')] #例如,(5, 3, 'bcz')表示下标5之后长度为3的子串
评论
ToolGood.Words敏感词检测组件
ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。非法词(敏感词)检测类有:StringSearch、Words
ToolGood.Words敏感词检测组件
0
automaton基于DFA的Regex库
java版的基于DFA的Regex库,只支持比较古老的正则表达式语法,不能兼容perl的正则语法;尽管有种种的限制,但是它是基于DFA的,对于做多模匹配还是很适当的。
automaton基于DFA的Regex库
0
Sonar WordCheck Plugin高性能敏感词检测插件
sonar-wordcheck-plugin 是一款用于SonarQube的高性能敏感词检测插件,支持代码内容检测、代码注释检测功能。本插件是基于SonarQube代码质量检测工具编写的一个为了检测用
Sonar WordCheck Plugin高性能敏感词检测插件
0