WuKong Search全文搜索引擎
WuKong 全文搜索引擎。功能特性:
高效索引和搜索(1M条微博500M数据28秒索引完,1.65毫秒搜索响应时间,19K搜索QPS)
支持中文分词(使用sego分词包并发分词,速度27MB/秒)
支持计算关键词在文本中的紧邻距离(token proximity)
支持计算BM25相关度
支持持久存储
可实现分布式索引和搜索
采用对商业应用友好的Apache License v2发布
示例代码:
package main import ( "github.com/huichen/wukong/engine" "github.com/huichen/wukong/types" "log" ) var ( // searcher是协程安全的 searcher = engine.Engine{} ) func main() { // 初始化 searcher.Init(types.EngineInitOptions{ SegmenterDictionaries: "github.com/huichen/wukong/data/dictionary.txt"}) defer searcher.Close() // 将文档加入索引 searcher.IndexDocument(0, types.DocumentIndexData{Content: "此次百度收购将成中国互联网最大并购"}) searcher.IndexDocument(1, types.DocumentIndexData{Content: "百度宣布拟全资收购91无线业务"}) searcher.IndexDocument(2, types.DocumentIndexData{Content: "百度是中国最大的搜索引擎"}) // 等待索引刷新完毕 searcher.FlushIndex() // 搜索输出格式见types.SearchResponse结构体 log.Print(searcher.Search(types.SearchRequest{Text:"百度中国"})) }
评论
Sphinx Search全文搜索引擎
Sphinx是一个开源的全文搜索服务器,从头开始设计时就考虑到了性能、相关性(又名搜索质量)和集成的简单性。它是用C++编写的,适用于Linux(RedHat、Ubuntu等)、Windows、Mac
Sphinx Search全文搜索引擎
0
Riot Search分布式全文搜索引擎
riot是一个分布式全文搜索引擎,采用Go语言开发。功能特性:高效索引和搜索(1M条微博500M数据28秒索引完,1.65毫秒搜索响应时间,19K搜索QPS)支持中文分词(使用 gse分词包并发分词,
Riot Search分布式全文搜索引擎
0
Senna Search嵌入式全文搜索引擎
Senna是一个可嵌入式的全文搜索引擎,可用在各种不同的脚本语言和数据库中。Senna是一个倒排索引的引擎,并结合最好的n元语法的索引和词索引,以实现快速,精确的搜索。虽然塞纳是相当紧凑的代码是可扩展
Senna Search嵌入式全文搜索引擎
0
FullproofJavaScript 全文搜索引擎
Fullproof是一个JavaScript库,提供了在浏览器上的高质量的全文搜索引擎。该特性可让你的Web应用在离线模式下使用HTML5离线特性进行搜索。特征:支持布尔值和搜索排名自动HTML5存储
FullproofJavaScript 全文搜索引擎
0
Groonga全文搜索引擎
Groonga是一款可嵌入式的全文搜寻引擎,具有储存功能和全文搜寻的检索功能,可实现近乎实时的搜索、数据更新不会对索引读产生锁操作。同时提供面向列的数据库管理系统,与常规的SQL数据库(如MySQL、
Groonga全文搜索引擎
0