ftserver轻量精准全文搜索服务器
FTServer(FTS)是一个轻量精准全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,精准搜索中文长句子,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词。非常容易按需定制,直接编译就可以使用,无需额外配置,同时可以嵌入到各种应用内部。
Java版本测试<<射雕英雄传>>全书在一个数据库事务内建完整索引在30秒内。查出里面3643个不同位置的"黄蓉"稳定在0.1秒内.无需词库,支持搜索"时察"这类没独立意义的词。
1.那时察合台还不知...
2.梅超风和他手掌相交,立时察觉...
3.这时察合台的六犬已快嗅到干草堆前...
测试支持 English, 简体中文, 正體中文, 日本語。 代码能支持 한국어, Русский, Deutsch。支持多语言混合搜索。
安装:
1. Java 版本可以从Release 中下载 fts.zip,解压后是一个War文件,直接在Tomcat或者Jetty上Deploy就可以使用了。
2. C#版本直接下载代码,放入一个支持asp.net的服务器中就可以了,例如Mono中带的xsp4 。
使用:
输入网址就可以录入内容,输入关键字就可以进行搜索
双代码版本
JAVA版本代码,
C#版本代码。
还有一个简单易读的中文引擎简化版本,去掉了英文单词处理,对象转换等一些操作,可以2分钟了解整个结构,然后根据需要扩展。
评论