Tag: Lucene

lucene 分布式运行框架 Nut 1.0a4 测试实例

nick | java | 2010-08-02
项目地址:http://code.google.com/p/nutla/ 1、从 http://www.mongodb.org/display/DOCS/Downloads 下载mongodb windows版本。创建目录 d:\db,解压下载的mongodb,在其bin目录 下运行启动命令:Mongod.exe –dbpath=d:\db 2、从 http://code.google.com/p/nutla/downloads/list 下载 nuttest.war ,放在tomcat6下的webapps目录下 3、http://127.0.... [阅读全文]

solr-1.4.1安装笔记

nick | java, 未分类 | 2010-07-22
Solr是一个基于Lucene java库的企业级搜索服务器,本文记录了solr的安装过程,版本为最新的1.4.1。 1) 下载 从solr的官网http://lucene.apache.org/solr/找到最新的版本1.4.1. 解开下载的apache-solr-1.4.1.zip或apache-solr-1.4.1.tgz文件到apache-solr-1.4.1目录. 2) 简易安装 solr的发布包中包含一些example,为了方便的运行这些example,solr的发布... [阅读全文]

RDBMS的lucene爬虫

nick | mysql, 互联网, 学习 | 2010-05-08
主要介绍如何周期性尽量实时地从RDBMS爬数据然后建索引,不涉及AOP或ORM Framework的listener方式。 先决条件: 1. Lucene索引是从无到有的,一开始所有数据都是存储在RDBMS(Oracle)中。 2. 数据表有一列是updateTime或称为lastModifiedTime用来存储最后一次更新时间,并建有db索引 3. 主表必须要有主键,这个主键也用来唯一确定一个Lucene ... [阅读全文]

使用zend Framework的lucene进行全文检索——中文分词

nick | php | 2010-05-08
zf本身没有提供中文分词算法,具体应用中要自己写。我这里使用简单的二元分词算法(只在utf-8下工作正常,对于其他字符集,请修改程序)。 第一步、如何测试分词算法的输出。 在zf 的手册中没有提到,我这里简单给个例子: 这里使用是zf默认的分词算法Zend_Search_Lucene_Analysis_Analyzer_Common_Text。另外你可以加上一个过滤方法。比如说过滤... [阅读全文]

Zend Search Lucene使用的问题

nick | php | 2010-05-08
单独把zend_search组件提取出来,在网上找到一个 例程 ,我用的版本是0.9.2beta creat.php创建索引程序 ser.php 检索程序 [阅读全文]
Ɣ回顶部