`
yanlijun250
  • 浏览: 750977 次
文章分类
社区版块
存档分类
最新评论

lucene之旅(一)——Lucene总览

 
阅读更多

Lucene是一款开源的搜索软件,它包括以下子项目:

  • lucene java,王牌子项目,提供基于java的索引和搜索技术,还有拼写检查,匹配高亮和高级的分词能力。
  • Driods,是一款智能的自动爬取框架,目前还是孵化状态。
  • Lucene.Net,lucene的C#版本,也在孵化中。
  • Lucy,Lucene的C版本,大部分是用C实现的。
  • Mahout,lucene的子项目,目的是建立一套不断学习进化的机制。
  • Nutch,基于Lucene用BS结构实现的搜索引擎。
  • Open Relevance Project,一个新的子项目,主要是做关联测试和信息检索,并加入了机器学习机制。
  • PyLucene,Lucene的Python版本。
  • Solr,基于Lucene建立的搜素服务,提供了各种接口。
  • Tika,文本分析工具库,包括元数据的检测和提取,以及构造文档目录等。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics