jieba-analysis结巴分词(java版)

联合创作 · 2023-09-29 05:24

首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。


结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。


结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for_index、cut_for_search),词性标注,关键词提取没有实现(今后如用到,可以考虑实现)。


简介


支持分词模式



  • Search模式,用于对用户查询词分词

  • Index模式,用于对索引文档分词


如何获取



  • git clone https://github.com/huaban/jieba-analysis.git

  • cd jieba-analysis

  • mvn package install ,安装到本地仓库

  • 在你的 pom.xml 文件中添加以下依赖。

浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报