Luke功能:
经由document编号或者term浏览索引
魔难document内容,可复制到剪贴板
对于频率最高的term的索引字段提供排名后的浏览
实施搜查语句并浏览搜查服从
合成搜查服从
从索引中抉择性删除了文件
重修原始文档字段,对于其妨碍编纂,而后重新插入的索引
优化索引
可能掀开hadoop文件零星内的索引文件
情景要求:
Luke是java语音写的开源软件,需要装置JRE1.6以上java情景反对于。
lucene 索引魔难工具奈何样用?
启动后抉择你的索引文件道路,抉择read-only掀开:
overview界面是用来妨碍索引的艰深性魔难以及操作的,好比索引目录,域信息,版本,term信息,Rank排名等信息。留意,索引文件里Analyze却不Store的字段信息仍是不私见的,也便是只能看STORE了的内容。
documents界面是用来妨碍文档的操作以及魔难的,能凭证文档编号以及词妨碍查找,着实这个便是搜查功能。
search界面是可能妨碍索引的搜查测试,可能编写lucene搜查语句,看到语句剖析后的query树,还可能抉择妨碍搜查的分词器、默认字段以及一再搜查次数,而后下面的listview中就会列出一个搜查的的文档的所有保存的(store)字段的值,可能看到查问破费的光阴
file界面,故名思义,这个便是用来魔难每一个索引相关文件的一些属性的界面,详细的话,可能经由这个界面合成下索引文件的多少多,是否需要优化概况并吞等等
最后一个plugins界面,便是可能看到luke提供的种种插件。比力实用的仍是分词工具,提供一个分词的类,而后下面文本框输入一段文本,而后就能让这个工具帮你分词,你可能看到详细的分词信息,对于自界说分词器的调试概况测试。尚有一个hadoop插件,反对于从hadoop节点中取患上节点中文件的相关信息,对于扩散式搜查引擎搭建实用,算是反对于多平台的lucene索引文件块的魔难。
总体清晰Lucene
着实Lucene构建的索引,不论从妄想上说仍是功能上说,以及一个DBMS数据库很相似,你可能以为Luke做的使命便是包装了Lucene的IndexReader以及IndexSearcher之后,酿成一个界面化的索引揭示以及规画工具。你残缺可能自己写挨次在cmd里魔难,可是不Luke提供的揭示那末直不雅以及多样。