simhashsimhash算法库

0粉丝
专门针对中文文档的simhash算法库简介此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。详见SimhashBlog特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hp
简介
专门针对中文文档的simhash算法库简介此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。详见SimhashBlog特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hp... 更多
其它信息
授权协议
MIT
开发语言
C/C++
操作系统
Linux
软件类型
开源软件
所属分类
神经网络/人工智能、 自然语言处理
开源组织
地区
国产
适用人群
未知

时光轴

里程碑1
LOG0
2023
09-25
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%