Tantivy全文搜索引擎库
Tantivy 是一个用 Rust 编写的搜索引擎库,其灵感来自于 Lucene。
得益于 Rust 语言加持,Tantivy 性能比 Lucene 要好得多
主要特性:
- 全文搜索
- 可配置的分词器,支持 17 种语言词干,包括中文、日文和韩文
- 速度非常快(check out the 🐎 ✨ benchmark ✨ 🐎)
- 启动时间极短 (<10ms), perfect for command-line tools
- BM25 评分 (与 Lucene 相同)
- 自然查询语言 (e.g.
(michael AND jackson) OR "king of pop"
) - 短语查询搜索 (e.g.
"michael jackson"
) - 增量索引
- 多线程索引
- Mmap 目录
- SIMD 整数压缩,支持 SSE2 指令集
- 快速的单值和多值 u64, i64, f64 字段 (等同于 lucene 中的 doc values)
-
&[u8]
fast fields - Text, i64, u64, f64, dates, and hierarchical facet fields
- LZ4 压缩文档存储
- 范围搜索
- Faceted 搜索
- 可配置的索引
- JSON 字段
- 聚合收集器,包括 range buckets, average, and stats metrics
- LogMergePolicy with deletes
- Searcher Warmer API
- Cheesy logo with a horse
评论