這篇文章主要講解了“solr是什么”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“solr是什么”吧!
創(chuàng)新互聯(lián)成都網(wǎng)站建設(shè)按需定制設(shè)計(jì),是成都營銷推廣公司,為餐廳設(shè)計(jì)提供網(wǎng)站建設(shè)服務(wù),有成熟的網(wǎng)站定制合作流程,提供網(wǎng)站定制設(shè)計(jì)服務(wù):原型圖制作、網(wǎng)站創(chuàng)意設(shè)計(jì)、前端HTML5制作、后臺(tái)程序開發(fā)等。成都網(wǎng)站設(shè)計(jì)熱線:028-86922220
##Solr Features## Solr是一個(gè)提供類似REST的API的獨(dú)立的企業(yè)級(jí)檢索服務(wù)器。你可以通過XML、JSON、CVS或者HTTP的二進(jìn)制來存儲(chǔ)文檔(或者稱為索引)。你可以通過HTTP GET方法查詢并且接受XML、JSON、CVS或者二進(jìn)制數(shù)據(jù)。
先進(jìn)的全文檢索功能
為高吞量的網(wǎng)略流量進(jìn)行優(yōu)化
基于開放接口標(biāo)準(zhǔn)-XML、JSON和HTTP
全面的HTML管理接口
服務(wù)器統(tǒng)計(jì)信息暴露,可以通過JMX來監(jiān)控
線性可擴(kuò)展,自動(dòng)索引復(fù)制,自動(dòng)故障轉(zhuǎn)移和恢復(fù)
近乎實(shí)時(shí)索引
基于XML配置的靈活性和適應(yīng)性
可擴(kuò)展的插件架構(gòu)
###Solr使用Lucene檢索庫并擴(kuò)展它###
一個(gè)真實(shí)的數(shù)據(jù)模式,包括數(shù)字類型、動(dòng)態(tài)字段、唯一鍵
對(duì)Lucene查詢語言強(qiáng)大的擴(kuò)展功能
方面檢索和過濾
支持每個(gè)文檔中多點(diǎn)和地理多邊形的地理空間檢索
先進(jìn)的,可配置的文本分析器
高度可配置性和用戶可擴(kuò)展緩存
性能優(yōu)化
基于XML的可擴(kuò)展配置
基于AJAX的管理接口
可監(jiān)視的日志
快速接近實(shí)時(shí)的增量索引和索引復(fù)制
基于跨多個(gè)主機(jī)的索引分片的高度可擴(kuò)展的分布式檢索
JSON、XML、CVS/delimited-text,和二進(jìn)制更新格式
簡單的方式拉取數(shù)據(jù),從數(shù)據(jù)庫、本地磁盤上的XML文件,或者HTTP資源
使用Apache Tika來解析和索引富文本(PDF、Word、HTML等)
基于Apache UIMA集成配置的元數(shù)據(jù)提取
多檢索索引
####Schema####
定義文檔字段并指定字段類型
可以驅(qū)動(dòng)更智能的處理
申明lucene 分詞器
動(dòng)態(tài)字段是能夠即時(shí)的添加新的字段
字段復(fù)制功能允許索引單個(gè)字段多種方式,或多個(gè)字段合并成一個(gè)單一的搜索領(lǐng)域
顯式類型,排序了猜測字段類型的必要
基于擴(kuò)展(外部文件)文件的配置停用詞列表、同義詞列表、保護(hù)詞列表
許多額外的文本分析組件,包括單詞分割,正則表達(dá)式和sounds-like過濾器
每個(gè)字段都有可插拔的類似模型
####Query####
HTTP接口提供可配置的響應(yīng)格式(XML/XSLT、JSON、Python、Ruby、PHP、Velocity、CSV、二進(jìn)制)
可通過任意數(shù)量的字段或者對(duì)于任意數(shù)量字段的復(fù)雜函數(shù)來排序
高級(jí)的DisMax查詢分析器從用戶輸入的查詢中獲得高度相關(guān)的結(jié)果
高亮上下文片段
基于唯一字段值、明確的查詢、日期范圍、數(shù)字范圍或者點(diǎn)的方面檢索
通過標(biāo)簽或者可選擇的執(zhí)行過濾來實(shí)現(xiàn)多方面檢索
對(duì)用戶查詢進(jìn)行拼寫建議
給定文檔的相似性建議
函數(shù)查詢-影響用戶指定復(fù)雜的數(shù)值字段或查詢相關(guān)度分值函數(shù)的得分
通過函數(shù)查詢對(duì)結(jié)果范圍進(jìn)行過濾
Range filter over Function Query results
Date Math - specify dates relative to "NOW" in queries and updates
通過carrot2進(jìn)行動(dòng)態(tài)檢索結(jié)果聚類
數(shù)字字段統(tǒng)計(jì),如最小值,最大值,平均值,標(biāo)準(zhǔn)偏差
Combine queries derived from different syntaxes
自動(dòng)建議功能完成用戶查詢
允許配置一個(gè)查詢的最優(yōu)先的結(jié)果,這些結(jié)果可以覆蓋正常的得分和排序
簡單連接兩個(gè)文檔類型功能
性能優(yōu)化
####Core####
動(dòng)態(tài)的創(chuàng)建或者刪除文檔集合而不用重啟服務(wù)
可插拔的查詢處理器和可擴(kuò)展的XML數(shù)據(jù)格式
可插拔的用戶函數(shù)供函數(shù)查詢
可定制的基于組建的請(qǐng)求處理器并且支持分布式檢索
基于unique key 字段的文檔唯一性加強(qiáng)
重復(fù)文件檢測,包括 fuzzy near duplicates
可定制的索引處理鏈,允許索引前對(duì)文檔處理
User configurable commands triggered on index changes
Ability to control where docs with the sort field missing will be placed
"Luke" request handler for corpus information
####SolrCloud####
基于Apache ZooKeeper 的集中式的配置
自動(dòng)分布式索引/分片,發(fā)送文檔到任意節(jié)點(diǎn)并且文檔會(huì)被轉(zhuǎn)發(fā)到正確的分片
基于立即推模型(同時(shí)也支持緩慢拉模型復(fù)制)復(fù)制的近實(shí)時(shí)索引
事務(wù)日志確保即使更新文檔沒有索引到磁盤也不會(huì)丟失
如果失敗時(shí)的自動(dòng)索引故障轉(zhuǎn)移、索引leader選舉和故障恢復(fù)
無單點(diǎn)故障
####Admin Interface####
對(duì)于緩存利用、更新和查詢的綜合統(tǒng)計(jì)
包括索引統(tǒng)計(jì)的交互模式瀏覽
復(fù)制監(jiān)控
圖形化集群節(jié)點(diǎn)狀態(tài)的SolrCloud儀表盤
全日志控制
文本分析調(diào)試,顯示一個(gè)分析器每個(gè)階段的分析結(jié)果
Web查詢接口,w/ 調(diào)式輸出
解析的查詢輸出
基于Lecene explain()的文檔得分詳細(xì)設(shè)計(jì)
Explain score for documents outside of the requested range to debug why a given document wasn't ranked highe
感謝各位的閱讀,以上就是“solr是什么”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)solr是什么這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!
本文題目:solr是什么
標(biāo)題路徑:http://jinyejixie.com/article24/ijohje.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、Google、企業(yè)建站、移動(dòng)網(wǎng)站建設(shè)、搜索引擎優(yōu)化、響應(yīng)式網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)