在篩選文本時(shí),有時(shí)你可能想根據(jù)某個(gè)給定的條件或使用一個(gè)可被匹配的特定模式,去標(biāo)記某個(gè)文件或數(shù)行字符串中的某幾行。使用 awk 來完成這個(gè)任務(wù)是非常容易的,這也正是 awk 中可能對(duì)你有所幫助的幾個(gè)功能之一。
![](/d/20211018/39dddfd106dc27308ef5bdaafd4b12c2.gif)
讓我們看一看下面這個(gè)例子,比方說你有一個(gè)寫有你想要購買的食物的購物清單,其名稱為 food_prices.list,它所含有的食物名稱及相應(yīng)的價(jià)格如下所示:
$ cat food_prices.list No Item_Name Quantity Price 1 Mangoes 10 $2.45 2 Apples 20 $1.50 3 Bananas 5 $0.90 4 Pineapples 10 $3.46 5 Oranges 10 $0.78 6 Tomatoes 5 $0.55 7 Onions 5 $0.45
然后,你想使用一個(gè) (*) 符號(hào)去標(biāo)記那些單價(jià)大于 $2 的食物,那么你可以通過運(yùn)行下面的命令來達(dá)到此目的:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list
![](/d/20211018/927587ed0286acba7b0d6f19b0c024f6.gif)
打印出單價(jià)大于 $2 的項(xiàng)目
從上面的輸出你可以看到在含有芒果和菠蘿的那行末尾都已經(jīng)有了一個(gè) (*) 標(biāo)記。假如你檢查它們的單價(jià),你可以看到它們的單價(jià)的確超過了 $2 。
在這個(gè)例子中,我們已經(jīng)使用了兩個(gè)模式:
第一個(gè)模式: / */$[2-9]/.[0-9][0-9] */ 將會(huì)得到那些含有食物單價(jià)大于 $2 的行。
第二個(gè)模式: /*/$[0-1]/.[0-9][0-9] */ 將查找那些食物單價(jià)小于 $2 的那些行。
上面的命令具體做了什么呢?這個(gè)文件有四個(gè)字段,當(dāng)模式一匹配到含有食物單價(jià)大于 $2 的行時(shí),它便會(huì)輸出所有的四個(gè)字段并在該行末尾加上一個(gè) (*) 符號(hào)來作為標(biāo)記。
第二個(gè)模式只是簡(jiǎn)單地輸出其他含有食物單價(jià)小于 $2 的行,按照它們出現(xiàn)在輸入文件 food_prices.list 中的樣子。
這樣你就可以使用模式來篩選出那些價(jià)格超過 $2 的食物項(xiàng)目,盡管上面的輸出還有些問題,帶有 (*) 符號(hào)的那些行并沒有像其他行那樣被格式化輸出,這使得輸出顯得不夠清晰。
我們?cè)?awk 系列的第二部分中也看到了同樣的問題,但我們可以使用下面的兩種方式來解決:
1、可以像下面這樣使用 printf 命令,但這樣使用又長(zhǎng)又無聊:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4 "*" ; } / */$[0-1]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4; }' food_prices.list
![](/d/20211018/651282e11f9864b0a9bf6fb17f697cbd.gif)
使用 Awk 和 Printf 來篩選和輸出項(xiàng)目
2、 使用 $0 字段。Awk 使用變量 0 來存儲(chǔ)整個(gè)輸入行。對(duì)于上面的問題,這種方式非常方便,并且它還簡(jiǎn)單、快速:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $0 "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list
![](/d/20211018/e0a5fbca18f7b13608f11097d3cb437c.gif)
使用 Awk 和變量來篩選和輸出項(xiàng)目
結(jié)論
這就是全部?jī)?nèi)容了,使用 awk 命令你便可以通過幾種簡(jiǎn)單的方法去利用模式匹配來篩選文本,幫助你在一個(gè)文件中對(duì)文本或字符串的某些行做標(biāo)記。