Tag: Lucene
lucene 分布式运行框架 Nut 1.0a4 测试实例
nick | java | 2010-08-02
项目地址:http://code.google.com/p/nutla/
1、从 http://www.mongodb.org/display/DOCS/Downloads 下载mongodb windows版本。创建目录 d:\db,解压下载的mongodb,在其bin目录
下运行启动命令:Mongod.exe –dbpath=d:\db
2、从 http://code.google.com/p/nutla/downloads/list 下载 nuttest.war ,放在tomcat6下的webapps目录下
3、http://127.0.... [阅读全文]
solr-1.4.1安装笔记
Solr是一个基于Lucene java库的企业级搜索服务器,本文记录了solr的安装过程,版本为最新的1.4.1。
1) 下载
从solr的官网http://lucene.apache.org/solr/找到最新的版本1.4.1.
解开下载的apache-solr-1.4.1.zip或apache-solr-1.4.1.tgz文件到apache-solr-1.4.1目录.
2) 简易安装
solr的发布包中包含一些example,为了方便的运行这些example,solr的发布... [阅读全文]
RDBMS的lucene爬虫
主要介绍如何周期性尽量实时地从RDBMS爬数据然后建索引,不涉及AOP或ORM Framework的listener方式。
先决条件:
1. Lucene索引是从无到有的,一开始所有数据都是存储在RDBMS(Oracle)中。
2. 数据表有一列是updateTime或称为lastModifiedTime用来存储最后一次更新时间,并建有db索引
3. 主表必须要有主键,这个主键也用来唯一确定一个Lucene ... [阅读全文]
使用zend Framework的lucene进行全文检索——中文分词
nick | php | 2010-05-08
zf本身没有提供中文分词算法,具体应用中要自己写。我这里使用简单的二元分词算法(只在utf-8下工作正常,对于其他字符集,请修改程序)。
第一步、如何测试分词算法的输出。
在zf 的手册中没有提到,我这里简单给个例子:
这里使用是zf默认的分词算法Zend_Search_Lucene_Analysis_Analyzer_Common_Text。另外你可以加上一个过滤方法。比如说过滤... [阅读全文]
Zend Search Lucene使用的问题
nick | php | 2010-05-08
单独把zend_search组件提取出来,在网上找到一个 例程 ,我用的版本是0.9.2beta
creat.php创建索引程序
ser.php 检索程序
[阅读全文]