wordfilter敏感词过滤工具
wordfilter 是一个用 DFA 算法实现的敏感词过滤工具,支持 Skip 参数控制敏感词干扰噪音,支持白名单跳过白名单词汇,支持在线添加和删除敏感词,管理敏感词库。
API 预览
-
敏感词替换
String text = "我们决定紧急征调5000人前往宅区帮助灾民,并且决定为紧急事件打开绿灯";
filter.replace(text); -
是否包含敏感词
String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
filter.include(text); -
获取敏感词数
String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
int result = filter.wordCount(text); -
获取敏感词列表
String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
List<String> words = filter.wordList(text); -
增加白名单功能
- blacklist.txt
- whitelist.txt -
增加方法重载
- replace(final String text) // distance=0&symbol=*
- replace(final String text, final char symbol) // distance=0
- include(final String text) // distance=0
- wordCount(final String text) // distance=0
- wordList(final String text) // distance=0 -
增加在线添加敏感词方法
//此处将5000加入黑名单
context.addWord(Collections.singletonList("5000"), WordType.BLACK); -
增加在线删除敏感词方法
//此处将5000移出黑名单(若黑名单没有该词组将忽略)
context.removeWord(Collections.singletonList("5000"), WordType.BLACK);
//此处将紧急事件移出白名单(若白名单没有该词组将忽略)
context.removeWord(Collections.singletonList("紧急事件"), WordType.WHITE);
评论
