博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Lucene简单介绍
阅读量:5145 次
发布时间:2019-06-13

本文共 678 字,大约阅读时间需要 2 分钟。

【2016.6.11】以前写的笔记,拿出来放到博客里面~

相关软件:

Solr, IK Analyzer, Luke, Nutch;Tomcat;

1.是什么:

Lucene是apache软件基金会jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包;为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎;

2.主要应用:

对句子进行分词,从而实现自然语言分词后提取关键词并且进行拓展,再送入搜索引擎进行查询,提高精准度;对数据库中的文档简历索引,实现快速的查找;

3.环境:

用java开发,很方便调用jar包;

4.具体类:

org.apache.lucene.analysis;语言分析器,主要用于分词;

5.相关的开源类库:

IK Analyzer

6.Lucene的开源企业搜索平台:

Solr:Solr是用Java编写、运行在Servlet容器(如Apache Tomcat或Jetty)的一个独立的全文搜索服务器;Solr是高度可扩展的,并提供了分布式搜索和索引复制;

7.Nutch:

是一个开源的java实现的web 爬虫;主要用于收集网页数据然后进行分析,建立索引等,底层使用Hadoop进行分布式计算与存储,索引使用Solr分布式索引框架;依赖Hadoop的数据结构,适合批处理;可以和Solr结合使用,用Solr分析检索Nutch爬过的页面;

转载于:https://www.cnblogs.com/robin2ML/p/6831886.html

你可能感兴趣的文章
Java面试题--基础知识部分
查看>>
编译器结构
查看>>
jvm 指令重排
查看>>
PL/SQL 游标详解
查看>>
php随机输出验证码
查看>>
压缩服务器中的文件夹,并下载到电脑
查看>>
pytorch初步学习(一):数据读取
查看>>
Android 消息推送
查看>>
关于 js 中的选择
查看>>
22Spring基于配置文件的方式配置AOP
查看>>
php-执行header('Content-type:image/png');之后,浏览器总是输出源代码
查看>>
Enterprise Library 2.0 -- Caching Application Block
查看>>
ThinkPHP 入门
查看>>
mysql 索引原理
查看>>
H5页面在微信端的分享
查看>>
学习OpenStack之 (0):基础知识
查看>>
转:DSP学习经验
查看>>
[工具]渗透神器CobaltStrike 3.1.2 K8去后门破解版 & Windows版TeamServer
查看>>
prepareEditor
查看>>
背景图毛玻璃效果
查看>>