Tag: index

使用zend Framework的lucene进行全文检索——中文分词

nick | php | 2010-05-08
zf本身没有提供中文分词算法,具体应用中要自己写。我这里使用简单的二元分词算法(只在utf-8下工作正常,对于其他字符集,请修改程序)。 第一步、如何测试分词算法的输出。 在zf 的手册中没有提到,我这里简单给个例子: 这里使用是zf默认的分词算法Zend_Search_Lucene_Analysis_Analyzer_Common_Text。另外你可以加上一个过滤方法。比如说过滤... [阅读全文]
Ɣ回顶部