這篇文章將為大家詳細(xì)講解有關(guān)正則表達(dá)式性能優(yōu)化方法有哪些,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)是一家朝氣蓬勃的網(wǎng)站建設(shè)公司。公司專注于為企業(yè)提供信息化建設(shè)解決方案。從事網(wǎng)站開發(fā),網(wǎng)站制作,網(wǎng)站設(shè)計,網(wǎng)站模板,微信公眾號開發(fā),軟件開發(fā),微信小程序開發(fā),十多年建站對玻璃鋼坐凳等多個行業(yè),擁有豐富的網(wǎng)站維護(hù)經(jīng)驗。
這里說的正則表達(dá)式優(yōu)化,主要是針對目前常用的NFA模式正則表達(dá)式,詳細(xì)可以參考:正則表達(dá)式匹配解析過程探討分析(正則表達(dá)式匹配原理)。從上面例子,我們可以推斷出,影響NFA類正則表達(dá)式(常見語言:GNU Emacs,Java,ergp,less,more,.NET語言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實(shí)主要是它的“回溯”,減少“回溯”次數(shù)(減少循環(huán)查找同一個字符次數(shù)),是提高性能的主要方法。 我們來看個例子:
源字符串:<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>
匹配要求,匹配<script….>….</script>標(biāo)簽里面所有內(nèi)容,包括改標(biāo)簽
常見寫法(1),因為<script后面可能出現(xiàn)字符、空白、特殊符號等,還有標(biāo)簽里面也可能出現(xiàn)各種js代碼。我們簡單方法是:
正則表達(dá)式:<script.*?>.*?</script> (測試工具使用了:regexBuddy)
總共花費(fèi)115步,回溯了:48次。 因為我們使用”.”字符,匹配默認(rèn)情況下除了\n之外所有字符。
方法(2),我們分析特點(diǎn)發(fā)現(xiàn),<script…>后面,應(yīng)該是除了”>”之外都可以字符,然后一對<script>標(biāo)簽里面js內(nèi)容。可以定義為除了”<”之外。(這里面我只是舉例說明優(yōu)化方法,實(shí)際網(wǎng)頁中script標(biāo)簽里面,常見都會出現(xiàn)有”<”字符了)
正則表達(dá)式:<script[^?>]+>[^<]+</script>
19步,0次回溯! ,步驟只有原先的15%左右,性能幾倍的提升了!
從上面我們看到,不同正則表達(dá)式,對通用字符配平,性能相差會很大。減少“回溯”是最好的方法,減少回溯其中最主要的方法是:”用最小范圍的元字符,盡量避免用過大的元字符!”。一般規(guī)律如下:
1、使用正確的邊界匹配器(^、$、\b、\B等),限定搜索字符串位置
2、使用具體的元字符、字符類(\d、\w、\s等) ,少用”.”字符
3、使用正確的量詞(+、*、?、{n,m}),如果能夠限定長度,匹配最佳
4、使用非捕獲組、原子組,減少沒有必要的字匹配捕獲用(?:)
如:我想匹配一些英文字母,它后面接的是數(shù)字。如:abc1234,我可以寫 “\w+\d+”,也可以寫”[a-zA-Z]+\d+” ,其中第一個\w+會先匹配所有abc1234,然后回溯,匹配滿足\d+格式。一共4步,而后面這個只需要2步,步驟減少一半了!好了,今天就先到這里,歡迎大家討論、交流!
關(guān)于“正則表達(dá)式性能優(yōu)化方法有哪些”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
新聞標(biāo)題:正則表達(dá)式性能優(yōu)化方法有哪些
網(wǎng)站路徑:http://jinyejixie.com/article46/psigeg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、移動網(wǎng)站建設(shè)、用戶體驗、網(wǎng)站建設(shè)、定制網(wǎng)站、營銷型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)