来get一款全文本搜索工具

程序员考拉

共 1673字,需浏览 4分钟

 ·

2020-11-14 21:51

公众号关注 “GitHub今日热榜
设为 “星标”,带你挖掘更多开发神器!





2005年Google推出了Google Desktop这款桌面搜索工具,由于这款工具轻巧便捷还超级实用,所以它得到了广泛的关注。Google Desktop这款桌面搜索工具主要通过搜索关键词来锁定某个记不起文件名的文档,在进行本地文件的搜索时速度非常快,只不过该项目在2011年9月就已经停止了。


但是全文检索依然是很多人的刚需。假如你有一堆 Office 文档,但是记不起想要找到的文档的名字了,你只知道大概的内容又非常急切地想要找到它,这时候就需要全文搜索了。


AnyTXT Searcher就是一款超级好用的用来进行全文本搜索的工具。我们来看看AnyTXT Searcher的官方简介:AnyTXT Searcher一个桌面搜索工具,有着强大的全文搜索引擎,是 Google Desktop 的搜索替代品。



功能介绍 




1. 支持检索的文件格式


  • 纯文本格式(txt,cpp,html等)

  • Microsoft Outlook(eml)

  • Microsoft Word(doc,docx)

  • Microsoft Excel(xls,xlsx)

  • Microsoft PowerPoint(ppt,pptx)

  • 便携式文件格式(pdf)(测试版)


2. 建立文本检索


在搜索之前,首先要建立文本检索。


软件安装后会自动检索你硬盘里的文件,建立检索的速度非常快,基本上在启动之后就瞬间完成了。


按快捷键Ctrl+I(或者工具-索引管理)打开索引管理界面,在这里可以查看文件的索引完成情况。



AnyTXT Searcher默认是添加了 .pdf、.doc/.docx、.ppt/.pptx、.xls/.xlsx、.txt等格式的索引。


如果你想添加其他格式的文件索引,可以按下图点击添加:



可以看到,有文件类型文件夹两个选项,其中文件类型就不用解释了,而当你选择文件夹的时候,软件会将这个文件夹里包含的所有文件类型一次性导入,索引的时间可能会很长,所以这里一定要谨慎选择。


选中某一个类型,点击编辑:



可以看到,软件默认会排除 C:\Windows 文件夹,在这里你也可以根据自己的喜好排除其他文件夹。


3. 文件搜索


建立好索引之后,就可以搜索文件了。在搜索之前,有三个自定义选项:搜索范围,文件类型,搜索方式。


指定搜索范围,比如全部硬盘或指定特定的硬盘:



指定搜索的文件格式类型:



AnyTXT Searcher能够支持模糊匹配和精确全字匹配搜索。精确全字搜索很好理解,就是在搜索的时候输入想要搜索的文件的全名。而模糊匹配是只要出现关键词中的任意一个字,都会给你搜索出来。



另外,还有两点需要注意:


  1. 索引创建之后,如果添加了文件,是不会被立刻搜索到的,需要等待一段时间更新

  2. 想要检索 Word、Excel、PPT 格式,需要安装 Office 套件才行


对于第一点,你可以先删除这种文件的索引,然后重新添加,就会立即更新索引了。



搜索原理




AnyTXT Searcher的检索是基于索引的,在软件安装完成后会自动把你硬盘的全部文档都读取一遍,之后会建立一个本地数据库,这个过程会非常快,导致你几乎感觉不到索引文件的建立过程就可以进行文档的检索了。


有人可能会问,如果修改了某文档的内容,再搜索文档中相关的关键词,是不是以后就找不到这个文档了?


如果修改了某个文档的内容,立刻搜索文档中相关内容的关键词,可能是找不到的,因为它的数据库还没更新。


AnyTXT Searcher索引的默认更新周期是1小时,这意味着每隔一小时,她就会自动更新一次数据库。




公众号回复“2333”获取下载链接!









关注GitHub今日热榜,专注挖掘好用的开发工具,致力于分享优质高效的工具、资源、插件等,助力开发者成长!




浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报