wordfilter敏感词过滤工具

联合创作 · 2023-09-29 05:05

wordfilter 是一个用 DFA 算法实现的敏感词过滤工具,支持 Skip 参数控制敏感词干扰噪音,支持白名单跳过白名单词汇,支持在线添加和删除敏感词,管理敏感词库。


API 预览



  • 敏感词替换


    String text = "我们决定紧急征调5000人前往宅区帮助灾民,并且决定为紧急事件打开绿灯";
    filter.replace(text);

     


  • 是否包含敏感词


    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    filter.include(text);

     


  • 获取敏感词数


    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    int result = filter.wordCount(text);

     


  • 获取敏感词列表


    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    List<String> words = filter.wordList(text);

     


  • 增加白名单功能


    - blacklist.txt
    - whitelist.txt

     


  • 增加方法重载


    - replace(final String text) // distance=0&symbol=*
    - replace(final String text, final char symbol) // distance=0
    - include(final String text) // distance=0
    - wordCount(final String text) // distance=0
    - wordList(final String text) // distance=0

     


  • 增加在线添加敏感词方法


    //此处将5000加入黑名单
    context.addWord(Collections.singletonList("5000"), WordType.BLACK);

     


  • 增加在线删除敏感词方法


    //此处将5000移出黑名单(若黑名单没有该词组将忽略)
    context.removeWord(Collections.singletonList("5000"), WordType.BLACK);
    //此处将紧急事件移出白名单(若白名单没有该词组将忽略)
    context.removeWord(Collections.singletonList("紧急事件"), WordType.WHITE);

浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报