DocFetcher使用教程
文章树列

高效的文档文本检索工具

简介

DocFetcher 是一个使用 Java 语言开发的开源桌面搜索应用程序:它允许您搜索计算机上的文档内容,能够在 Windows,Linux 和 OS X 上运行。

image-20200227001050780

下载安装

运行环境:Java Runtime Environment(JRE)1.7 +

下载地址:http://docfetcher.sourceforge.net/en/download.html

安装方法:windows 平台请使用 .exe 安装包进行安装,其他平台请参照官方文档

使用方法

建立索引

为了快速的进行文本检索,DocFetcher 在检索文档文本前需要建立索引,用户可以根据需要为文件夹或者整个磁盘建立索引,当然,仅仅在第一次检索时需要为所要检索的文件夹或磁盘建立索引,建立索引后,当文件内容发生了变化 DocFetcher 会自动更新索引。以下是建立索引的详细方法:

step 1

如图所示,右击[搜索范围]框的空白处,选择弹出菜单中的[建立索引 - 资料夹]。

image-20200227001344003

step 2

在弹出的选择窗口中选择需要检索文档的位置,点击[确认]。

image-20200227001429248

step 3

在弹出的窗口中可以对索引的细节进行设置,可以选择所要检索的文件格式,在排除列表中可以使用正则表达式过滤不需要建立索引的文件和文件格式,其他选项没有特殊要求使用默认值即可。最后选择[执行],将开始建立索引。

image-20200227001521052

step 4

建立索引的过程耗时较长,具体时间取决于所选建立索引的文件夹中包含的文件数量及文件大小。索引建立完成后在首页的[搜索范围]框内便有了对应的目录。

image-20200227001611286

检索数据

对于建立好索引的目录,可以通过勾选检索目录、勾选文件类型、设定文件大小、输入关键字来进行文本检索。

检索语法

这里仅对 DocFetcher 的检索语法做简单介绍,详细内容请参照官方文档。

  • 短语搜索:需要将所要检索的短语放入英文双引号内。如 :”可转债”,返回包含词语”可转债”的文件;
  • 布尔运算:支持复杂条件的检索,常用运算符包含 AND、OR 、NOT 等,短语间没有运算符时将默认使用 OR。如 “可转债” AND “可交换债”,返回既包含短语”可转债”又包含短语”可交换债”的文件;
  • 通配符:问号('?')和星号('*')可用于表示某些字符未知。如 :”可”*,返回包含”可以”、”可转债”、”可交换债”等包含以”可”开头的语句的文件;
  • 模糊搜索:可以搜索与给定单词类似的单词。如,roam~,返回包含 foam 和的单词的文档 roams 的文件。

检索示例

检索包含短语”福报就越来越多”的文件,点击检索结果里的文件可以在下方的预览框预览文件的内容,预览中命中的检索关键字将被标红,如下图所示。
image-20200227002021497

检索即包含”处世” 和短语 “邀功” 的文件,如下图所示。

image-20200227002229097

设置

通过点击右上角的齿轮状按钮可以进入[设置]。在设置中可以对默认布尔运算符进行修改、自动预览一个人符合的项目、使用及时搜索等,还可以对预览的字体,命中文本的颜色,快捷键等进行设置。

image-20200227002349907

注意事项

内存大小限制

DocFetcher 的默认内存限制为 256 MB,因此 DocFetcher 运行时占用的内存大小和资源都是相当小的,但是当检索速度过慢或者索引建立时存在单个文件过大而导致索引建立失败则需要提高内存大小。

Windows 平台下,DocFetcher 内置了多个不同内存大小的启动器,其位于 DocFetcher 安装目录下的 misc 目录下。

在 misc 目录下,文件名”DocFetcher-2048_64-bit-Java.exe”中的”-2048”即是表示使用 2048MB 的内存启动,”64-bit-Java”表示为 64 位的启动程序,适用于 64 位系统。可根据自己的实际情况选择合适的启动器。

很重要的一点是,这些备用启动器在使用时需要将其从 misc 目录复制到 DocFetcher 安装目录下,复制完成后,双击该启动器即可启动对应内存大小的 DocFetcher。其他平台的增加内存方法请参照 DocFetcher-设置-说明。

检索关键字格式

检索中文,因为 DocFetcher 中文分词器的原因,如果想搜索整个词语请务必使用英文双引号括住,否则将导致 DocFetcher 将词语分词后使用 OR 运算进行检索,最终使检索结果出乎意料。

搜寻范围越界的问题

使用 DocFetcher 检索时,可能只是勾选了一个搜寻目录,但搜索结果可能包含了未勾选的目录的内文件,这可能是 DocFetcher 的一个 BUG,目前暂不清楚原因。解决方法是尝试勾选其他目录,再取消勾选,再点击搜索。

新版下载
本文原创,商业转载请联系作者获得授权,非商业转载请注明出处。

评论

发送评论 编辑评论


                        

windows分类热门文章

标签热门文章排行

☛免责声明 ☛本站使用教程
Theme Argon With Ry-Plus By 清欢
我的第21173位朋友,历经123843次回眸才与你相遇