Lucene是Apache的开源全文检索项目集合,包括Lucene Java,Nutch,Droids等多个项目,对于多数Java开发者来说,Lucene指的就是Lucene Java,当然彼此发布的Lucene 2.9.0说的也是Lucene 2.9.0版本。不过本次Lucene Java发布的版本有些特殊,直接从Lucene 2.4.1变成了 Lucene 2.9.0。因为之前传出Lucene 3.x将进行重大的变革,相信此次Lucene 的版本号大变化是为了迎接即将到来的3.x系列吧。
本次发布的Lucene 2.9.0仍然兼容早期Lucene版本,并重构了大量API,在很多功能上进行了增强:
- Lucene 2.9.0增加了分段搜索和缓存
- Lucene 2.9.0在IndexWriter中加入了接近实时搜索的能力。
- Lucene 2.9.0引入了新的Query类型
- Lucene 2.9.0引入了更加智能和灵活的多词期查询(通配符查询和范围查询)
- Lucene 2.9.0引入了新的经过优化的控制器和评分器API
- Lucene 2.9.0增强了对Unicode的支持和新的排序功能
- Lucene 2.9.0新增了TokenStreamAPI的属性
- Lucene 2.9.0新增了一个新的QueryParser框架。
- Lucene 2.9.0中通过字段排序时评分功能将是可选择的。
- Lucene 2.9.0增加了新的分析器,包括:PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer (最后这个是智能中文分析器)
- Lucene 2.9.0中新增了快速向量高亮处理大文档的方法
- Lucene 2.9.0支持高性能的数字域的处理,而不像以前版本那样需要转为文本存储
Lucene项目首页:
http://lucene.apache.org/index.html