用lucene檢索包,很強(qiáng)大。到官網(wǎng)下一個(gè)最新版本就可以進(jìn)行二次開發(fā)。
成都服務(wù)器托管,成都創(chuàng)新互聯(lián)提供包括服務(wù)器租用、綿陽電信機(jī)房、帶寬租用、云主機(jī)、機(jī)柜租用、主機(jī)租用托管、CDN網(wǎng)站加速、域名與空間等業(yè)務(wù)的一體化完整服務(wù)。電話咨詢:028-86922220
至于中文支持,可以使用流行的中文分詞包,建議用用paoding。
java實(shí)現(xiàn)文件搜索主要使用file類和正則表達(dá)式,如下示例:
package?com.kiritor.util;
import?java.io.File;
import?java.io.FileFilter;
import?java.util.Arrays;
import?java.util.Collections;
import?java.util.List;
/**
*?文件的相關(guān)操作類
*?
*?@author?Kiritor
*/
public?class?FileOperation?{
private?static?String?contentPath;
private?static?String?filePath;
private?static?File[]?fileList?=?null;//?保存文件列表,過濾掉目錄
public?FileOperation()?{
}
/**?構(gòu)造函數(shù)的參數(shù)是一個(gè)目錄?*/
public?FileOperation(String?path)?{
File?file?=?new?File(path);
if?(file.isDirectory())
this.contentPath?=?path;
else
this.filePath?=?path;
}
/**獲取文件列表*/
public?static?File[]?getFiles()?{
if?(contentPath?==?null)?{
File?file?=?new?File(filePath);
fileList?=?new?File[1];
fileList[0]?=?file;
return?fileList;
}
fileList?=?new?File(contentPath).listFiles(new?FileFilter()?{
/**使用過濾器過濾掉目錄*/
@Override
public?boolean?accept(File?pathname)?{
if(pathname.isDirectory())
{
return?false;
}else
return?true;
}
});
return?fileList;
}
/**?對當(dāng)前目錄下的所有文件進(jìn)行排序?*/
public?static?File[]?sort()?{
getFiles();
Arrays.sort(fileList,?new?FileComparator());
return?fileList;
}
public?static?void?tree(File?f,?int?level)?{
String?preStr?=?"";
for(int?i=0;?ilevel;?i++)?{
preStr?+=?"????";
}
File[]?childs?=?f.listFiles();
//返回一個(gè)抽象路徑名數(shù)組,這些路徑名表示此抽象路徑名表示的目錄中的文件。
for(int?i=0;?ichilds.length;?i++)?{
System.out.println(preStr?+?childs[i].getName());
if(childs[i].isDirectory())?{
tree(childs[i],?level?+?1);
}
}
}
//?提供一個(gè)"比較器"
static?class?FileComparator?implements?java.util.ComparatorFile?{
@Override
public?int?compare(File?o1,?File?o2)?{
//?按照文件名的字典順序進(jìn)行比較
return?o1.getName().compareTo(o2.getName());
}
}
}
談?wù)勎业目捶?,并不是具體如何去編程,僅僅是一個(gè)思路而已
1\建立一個(gè)微型的數(shù)據(jù)庫,然后做一個(gè)系統(tǒng)服務(wù),每隔一段時(shí)間就自動(dòng)運(yùn)行一次,搜索全盤文件系統(tǒng)的文件結(jié)構(gòu),并做索引記錄
2\你要進(jìn)行搜索的時(shí)候,直接數(shù)據(jù)庫查詢就行
思路來源:Linux系統(tǒng)的updatedb,然后locate查找文件的機(jī)制。你可以百度一下。
在業(yè)務(wù)邏輯層里操作不是都相同的么?為什么特別指出不需要JSP要用GUI呢?難道是用ajax寫?但你說在數(shù)據(jù)庫搜索內(nèi)容并顯示又不像ajax。搞不懂。
類似于下面那樣子的業(yè)務(wù)吧?:
String sql="select WP_PRODUCT.*,WP_PROD_CTGRY.C_NAME from WP_PRODUCT,WP_PROD_CTGRY where WP_PRODUCT.CTGRY_ID=WP_PROD_CTGRY.TID ";
ListObject params=new ArrayListObject();
if(type!=null!"".equals(type)){
sql+=" and CTGRY_ID like ?";
params.add(type+"%");
}
if(proName!=null!"".equals(proName)){
sql+=" and NAME like ?";
params.add("%"+proName+"%");
}
if(code!=null!"".equals(code)){
sql+=" and CUSTOM_ID like ?";
params.add(code+"%");
}
if(brandId!=null!"".equals(brandId)){
sql+=" and OWNER_ID = ?";
params.add(brandId);
}
if(netId!=null !"".equals(netId)) {
sql += " and WP_PRODUCT.TID IN(SELECT PRODUCT_ID FROM WP_NET_PRODUCT WHERE OWNER_ID = ?) ";
params.add(netId);
}
sql += " order by WP_PRODUCT.MOD_DATE desc";
this.getVisitor().createPaginationExecutor(sql, page, params.toArray()).pagination(WpProdBean.class);
import?java.io.*;
public?class?FileDemo{
public?static?void?main(String[]?args)throws?Exception{
//第一個(gè)參數(shù)是文件路徑,第二個(gè)參數(shù)是要搜索的文件擴(kuò)展名
getFile("D:\\JavaDemo",".txt");
}
private?static?void?getFile(String?pathName,?final?String?endsWith)throws?Exception{
File?file?=?new?File(pathName);
if(!file.exists())
throw?new?RuntimeException("文件不存在,你檢索個(gè)P呀。");
file.listFiles(new?FileFilter(){
public?boolean?accept(File?file){
if(file.getName().endsWith(endsWith)){
System.out.println(file.getName());
return?true;
}else
return?false;
}
});
}
}
一.???????????創(chuàng)建索引
1.一般創(chuàng)建索引的核心步驟
(1).?創(chuàng)建索引寫入對象IndexWriter:
IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);
參數(shù)說明:INDEX_STORE_PATH:??索引文件存放路徑
new StandardAnalyzer():?分詞工具
create:?此參數(shù)為Boolean型,true表示重新創(chuàng)建整個(gè)索引,?false?表示增量式創(chuàng)建索引。
(2).創(chuàng)建文檔模型,并用IndexWriter對象寫入
Document doc = new Document();
Field field1 = new Field(fieldName1, fieldValue ,??Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field1);
Field field2 = new Field(fieldName2, fieldValue ,??Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field2);
……
indexWriter.addDocument(doc);
indexWriter.close();
參數(shù)說明:
Document?:負(fù)責(zé)搜集數(shù)據(jù)源,它可以從不同的物理文件提取數(shù)據(jù)并放入同一個(gè)Document?中或從一個(gè)物理文件中提取出不同的數(shù)據(jù)并放入同一個(gè)Document中。
如下圖所示
? ? ? ? ? ?
Field?:用來表示不同的數(shù)據(jù)源
fieldName1:?表示field名稱
fieldValue:??表示field?的值
Field.Store.YES,:表示是否在索引文件中完整的存儲(chǔ)該值。
在創(chuàng)建索引時(shí),有些內(nèi)容需要以摘要的形式完整地或以片段的方式顯示在頁面上,來便于用戶查找想要的記錄,那么就應(yīng)該選擇存儲(chǔ),如果不需要完整或片段的顯示就不需要存儲(chǔ)。
Field.Index.TOKENIZED?:表示是否索引和分詞。
只要是需要當(dāng)作關(guān)鍵字讓用戶查找的字段就需要建立索引。
在建立索引的過程中,如果像文章標(biāo)題、文章內(nèi)容這樣的Field,?一般是靠用戶輸入幾個(gè)關(guān)鍵字來查詢的,就應(yīng)該選擇分詞。
如果需要用戶輸入完整字符也就是精確查找才能查詢到的,例如:beanName,就可以不分詞。
Document最直觀的理解方式:
Document就相當(dāng)于我們平臺中的一個(gè)普通javaBean,,而Field?就是javaBean中的一個(gè)屬性。lucene搜索的機(jī)制就是靠搜索指定的Field的值?,來得到含有要搜索內(nèi)容的Document?集合,所以問題的關(guān)鍵在于如何組織Document .
2.結(jié)合平臺創(chuàng)建索引的思路
(1)?經(jīng)分析搜索元素應(yīng)該由如下內(nèi)容組成(Document的屬性)
(2)?數(shù)據(jù)庫數(shù)據(jù)轉(zhuǎn)化為Document?的構(gòu)造過程:
JavaBean / Attachment?????→???(Temp Object) BaseData??→???(Finally Object) Document
分析:
要建立索引的源數(shù)據(jù)分為兩大部分:一個(gè)是數(shù)據(jù)庫數(shù)據(jù)?BeanData ,另一個(gè)是附件數(shù)據(jù)?FileData ,?這樣可以建立一個(gè)抽象類?BaseData ,?來存放它們共有的屬性。同時(shí)為了管理這些相應(yīng)的數(shù)據(jù),在相同的等級結(jié)構(gòu)上,建立了相應(yīng)的管理類(xxxDataManager) ,對這些數(shù)據(jù)類的操作(建立或刪除索引)進(jìn)行管理,并用一個(gè)工廠類(DataManagerFactory)來創(chuàng)建所需要的管理類,IndexHelper用來充當(dāng)整個(gè)索引模塊對外的接口,為了實(shí)現(xiàn)一些與平臺特定的業(yè)務(wù),特用SupportManager來提供一些額外的業(yè)務(wù)支持,索引模塊代碼結(jié)構(gòu)如下圖所示。
二.搜索索引
1.???lucene?搜索的核心步驟:
String[]??fields??=??{“title”,?“summary”,……};?????//要查找的field范圍
BooleanClause.Occur[]???flags??=??{BooleanClause.Occur.SHOULD, BooleanClause.Occur.?MUST ,……};
Query??query = MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());
Hits??hits??=??new??IndexSearcher(INDEX_STORE_PATH).search(query);
for (int i = 0;i hitsLength ; i++)
{
Document doc = hits.doc(i);
String title = doc.get(“title”);
String summary = doc.get(“summary”);
//?搜索出來的結(jié)果高亮顯示在頁面上
if (title != null) {
TokenStream tokenStream = analyzer.tokenStream(“title”,new StringReader(title));
String highlighterValue = highlighter.getBestFragment(tokenStream, title) ;
if(highlighterValue != null){
title = highlighterValue ;
}
//log.info("SearchHelper.search.title="+title);
}
if(summary!= null){
TokenStream tokenStream = analyzer.tokenStream(“summary”,new StringReader(summary));
String highlighterValue = highlighter.getBestFragment(tokenStream, creator) ;
if(highlighterValue != null){
summary = highlighterValue ;
}
//log.info("SearchHelper.search. summary ="+ summary);
}
}
2.結(jié)合平臺構(gòu)造搜索模塊
PageData?類用來存放檢索結(jié)果集數(shù)據(jù)。
PageInfo?類用來存放頁面相關(guān)信息例如,PageData對象集合、總記錄個(gè)數(shù)、每一頁的記錄數(shù)、?總頁面數(shù)量等等。
SearchHelper用來充當(dāng)整個(gè)搜索模塊的對外接口。
三.為平臺組件添加索引的步驟(以知識中心為例)
1.在com.cscec.oa.searchengine.extend.module?目錄下添加一個(gè)新的package
例如:com.cscec.oa.searchengine.extend.module.resourcestore
2.在新的目錄下建立data package?并建立相應(yīng)的數(shù)據(jù)類,并使這個(gè)數(shù)據(jù)類繼承BeanData。
例如:
package com.cscec.oa.searchengine.extend.module.resourcestore.data
public class ResourceStoreBeanData extends BeanData{
}
3.?與data package?同一級目錄建立manager package?并建立相應(yīng)管理類,并使這個(gè)管理類繼承BeanDataManager
例如:
com.cscec.oa.searchengine.extend.module.resourcestore.manager
public class ResourceStoreBeanDataManagerImpl extends BeanDataManager{
}
4.以管理員的身份登陸OA后,在菜單中找到“索引模塊管理”鏈接,將相應(yīng)信息添加完成后,便可以在List?頁面?點(diǎn)擊“創(chuàng)建索引”對該模塊的數(shù)據(jù)進(jìn)行索引的建立,建立完成后便可以進(jìn)行查詢。
文章標(biāo)題:j搜索引擎java代碼 java搜索框代碼
網(wǎng)頁URL:http://jinyejixie.com/article12/hehogc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供虛擬主機(jī)、網(wǎng)站導(dǎo)航、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站排名、云服務(wù)器、
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)