Tantivy全文搜索引擎库

联合创作 · 2023-09-29 03:13

Tantivy 是一个用 Rust 编写的搜索引擎库,其灵感来自于 Lucene。

得益于 Rust 语言加持,Tantivy 性能比 Lucene 要好得多

主要特性:

  • 全文搜索
  • 可配置的分词器,支持 17 种语言词干,包括中文、日文和韩文
  • 速度非常快(check out the 🐎  benchmark  🐎)
  • 启动时间极短  (<10ms), perfect for command-line tools
  • BM25 评分 (与 Lucene 相同)
  • 自然查询语言 (e.g. (michael AND jackson) OR "king of pop")
  • 短语查询搜索 (e.g. "michael jackson")
  • 增量索引
  • 多线程索引
  • Mmap 目录
  • SIMD 整数压缩,支持 SSE2 指令集
  • 快速的单值和多值 u64, i64, f64 字段 (等同于 lucene 中的 doc values)
  • &[u8] fast fields
  • Text, i64, u64, f64, dates, and hierarchical facet fields
  • LZ4 压缩文档存储
  • 范围搜索
  • Faceted 搜索
  • 可配置的索引
  • JSON 字段
  • 聚合收集器,包括 range buckets, average, and stats metrics
  • LogMergePolicy with deletes
  • Searcher Warmer API
  • Cheesy logo with a horse
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报