文本處理三劍客
成都創(chuàng)新互聯(lián)是一家專業(yè)從事成都網(wǎng)站設計、做網(wǎng)站、網(wǎng)頁設計的品牌網(wǎng)絡公司。如今是成都地區(qū)具影響力的網(wǎng)站設計公司,作為專業(yè)的成都網(wǎng)站建設公司,成都創(chuàng)新互聯(lián)依托強大的技術實力、以及多年的網(wǎng)站運營經(jīng)驗,為您提供專業(yè)的成都網(wǎng)站建設、營銷型網(wǎng)站建設及網(wǎng)站設計開發(fā)服務!
grep系:grep、egrep、fgrep,文本搜索工具,居于“PATTERN”對于給定的文本進行模糊搜索。
sed:tream EDitor,流編輯器,行編輯器,文本編輯工具;
awk:gawk--GNU awd,文本格式化工具,文本報告生成器,文本處理的編輯語言;
grep系:grep、egrep、fgrep
grep:Global search REgular expression and Print out the line.
利用增則表達式進行全局搜索并將匹配的行顯示出來;
格式:grep [OPTIONS] PATTERN [FILE...]
PATTERN:過濾條件,是由正則表達式元字符以及沒有特殊含義的文本字符組成。
正則表達式的元字符:會被正則表達式引擎解釋為特殊含義;pcre--perl語言的正則表達式引擎; 其中正則表達式分兩中:
一、基本的正則表達式:BRE;
二、擴展的正則表達式:ERE;
grep默認僅支持基本正則表達式;
egrep默認僅支持擴展正則表達式;
fgrep默認不開啟正則表達式;
文本字符:只具備字符表面含義的那些字符;
常用選項:
-i,--ignore-case:忽略文本字符的大小寫;
-v,--invert-match:方向匹配;最終顯示的結果是PATTERN不能匹配的行;
-c,--count:計數(shù),統(tǒng)計匹配PATTERN的所有行數(shù);
-o,--only-嗎t(yī)hing:關閉貪婪模式,僅顯示PATTERN能夠匹配的內容;
-q,--quiet,--silent:安靜模式,不輸出任何匹配結果;
--color[=WHEN],--colour[=WHEN]:將匹配PATTERN的內容以特殊顏色高亮顯示;
-E,--extended-regexp:擴展的正則表達式,grep -E相當于egrep;
-F,--fixed-strings,--fixed-regexp:grep -F相當于fgrep
-G,--basic-regexp:基本的正則表達式,egrep -G相當于grep
-P,--prel-regecp:使用PCRE(Perl Regular Expression)引擎;
-A NUM,--after-context=NUM:在顯示匹配PATTERN的行的同時顯示起后面的NUM行;
-B NUM, --before-context=NUM:在顯示匹配PATTERN的行的同時顯示起前面的NUM行;
-C NUM, -NUM, --context=NUM:在顯示匹配PATTERN的行的同時顯示起前后各NUM行;
PATTERN:
正則表達式元字符:
基本的正則表達式元字符:
GLOBBING-----簡化版的正則表達式:[] ? *
字符匹配:
.:匹配任意單個字符
[]:匹配指定范圍內的任意單個字符;
[^]:匹配指定范圍以外的任意單個字符;
下列所有的字符集都可以放置于[]之中用于匹配單個字符:
[:lower:]、[:upper:]、[:alpha:]、[:digit:]、[:space:]、[:alnum:]、[:punct:]、[:blank:]
[:xdigit:]:所有的十六進制數(shù)字;
a-z:所有的小寫字母
A-Z:所有的大寫字母
0-9:標識所有的十進制數(shù)字
次數(shù)匹配:該類字符之前的那個字符可以出現(xiàn)的次數(shù);
*:其前面的字符可以出現(xiàn)任意次(0次,1次或多次);
\?:其前面的字符可有可無(0次或1次);
\+:其前面的字符至少出現(xiàn)一次(1次或多次);
\{m\}:其前面的字符必須出現(xiàn)m次;
\{m,n\}:其前面的字符至少出現(xiàn)m次,至多出現(xiàn)n次;(m<n)
\{,n\}:其前面的字符至少出現(xiàn)0次,至多出現(xiàn)n次;
\{m,\}:其前面的字符至少出現(xiàn)m次,×××;
在正則表達式中,表示任意長度任意字符的方式:.*
位置錨定字符:
行錨定:
行首錨定:^
行尾錨定:$
字錨定:
字首錨定:\<或\b
字尾錨定:\>或\b
注意: \b:舊版本中的錨定方法,建議不使用:
對于正則表達式引擎來說,字是由非特殊字符組成的連續(xù)字符串;
網(wǎng)頁標題:我的朗科運維第六課(1)
網(wǎng)站鏈接:http://jinyejixie.com/article40/jjgoho.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供云服務器、、網(wǎng)頁設計公司、網(wǎng)站營銷、網(wǎng)站設計、品牌網(wǎng)站設計
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)