如何在Unix結果中抽取想要的參數
大部分的Unix操作系統命令,其命令執行后都會輸出比較詳細的參數。但是有時候系統工程師可能不需要這么詳細的信息。如date命令,其會顯示時間、日期、年數等等信息。但是系統工程師在開發一些應用程序的時候,可能只需要時間信息。為此就需要利用一些工具從中抽取相關的參數信息。其實不光光是在Unix系統管理中,在其他一些程序的開發平臺中也會遇到這種情況。而其他一些平臺的話,他們則是通過字符串截取或者其他一些類似的方法實現。而在Unix系統中則提供了一些比較專業的命令,用來操作位置參數。如set和shift命令。
在介紹這兩個命令的使用要點之前,筆者先給大家看一個截圖。如下圖所示,這張圖就是利用set命令來來操作位置參數。讓其從date命令中抽取部分結果。這個特性不僅可以格式化顯示結果,而且在shell中開發一些應用程序將會變得很有用。
一、set命令簡介。
在Unix系統中,set命令時一個很有用的系統命令,其可以幫助系統管理員實現很多需求,如設置環境變量等等。在這里,其主要是用來實現這支位置參數。其實在Unix系統中,有很多種方法可以用來實現在命令結果中抽取特定的參數。如可以利用外部命令cut實現從一個輸出結果中截取一個字段的內容。但是,利用cut命令來實現這個功能的話,就顯得有點業余了。既然Unix操作系統提供了其他一些更加專業的命令來實現這些功能,系統工程師為什么要舍近求遠呢?
其實在Unix系統中的標準shell中就提供了一些內部命令,來實現功能。其中set命令就是比較有代表性的一個命令。Set命令可以把參數賦值給$1、$2等位置參數。通過情況下,如果系統工程師要從程序的輸出結果中提取某些內容則往往是利用這個命令來實現。
二、set命令的具體實現過程以及需要注意的內容。
在談set命令的具體實現過程之前,筆者先跟大家介紹一些位置參數與命令顯示結果之間的關系。了解他們的內在關系是系統工程師使用操作位置參數命令的前提。如上圖所示,利用date命令顯示出“Mon Apr 20 08:29:40 CST 2009系統的當前時間的結果。這個結果從左到右其對應的存儲位置分別為$1、$2等等,以此類推。也就是說,這個顯示結果就好像其他開發程序中的數組,系統利用空格來區分字段,并把每個字段的內容依次存入到數組中。不過這里需要注意的是,其他開發程序的數組往往是從0開始。而在Unix系統中,這個位置參數則是從$1開始。為此系統工程師如果要截取第一個字段內容的話,則應該是$1而不是$0。筆者是先學C等開發語言平臺,然后再學Unix系統。由于有了一個先入為主的觀念,為此后來在使用set命令的時候,經常犯迷糊。故筆者提醒各位系統工程師,在這方面要特別注意顯示結果內容與位置參數的對應關系,第一個字段對應的位置參數位$1。了解了這個內容之后,則利用set命令來操縱顯示結果則就比較容易了。如上圖所示,通常情況下只需要通過簡單的兩不就可以完成這個功能了。
第一步:利用set命令把它的參數轉換為位置參數。
在使用這個命令之前,筆者認為系統工程師應該先明白一個道理。就是默認情況下,命令的輸出結果其往往都是顯示在終端中,或者通過重定向符號顯示在一個特定的文件中。但是無論是哪一種顯示方式,其往往不會跟位置參數關聯起來。如上圖中,一開始運行一個date命令時,會輸出相應的時間信息。此時這個輸出結果中有6個字段,但是其根本沒有跟位置參數形成一一對應的關系。其只是一個簡單的字符串而已。如果系統工程師要利用慚怍位置參數命令從這個結果沖抽取內容的話,則一定需要把命令的結果轉換為位置參數。而set命令就是用來實現這個目的的。
如利用set ‘date’命令,就可以利用把它的參數結果轉化為位置參數。如此設置之后,在顯示的結果中系統就會把第一個字段賦值給位置參數$1,第二個字段賦值給位置參數$2,依次類推。在這里筆者再強調一次,第一個位置參數為$1,而不是$0。因為筆者以前犯這個錯誤犯怕了,所以在這里不厭其煩的強調這個內容,希望能夠引起大家的重視。
第二步:利用echo命令來顯示位置參數所代表的內容。
把位置參數與輸出結果一一對應之后,系統工程師就可以利用echo命令或者在應用程序中直接引用位置參數從某個命令的輸出結果中截取相關的內容。通常情況下,系統工程師可以一次抽取一個字段,也可以一次抽取多個字段。而且難能可貴的是,命令中還可以使用通配符。如果系統工程師需要顯示所有位置參數所對應的內容,也就是原有命令顯示的結果,則可以利用echo $*來實現。通配符*號就表示所有的位置參數。不過需要注意的是,在引用位置參數的時候,要把前面的$美元符號加上去。即echo $1 與echo 1會顯示兩個不同的結果。前者就是位置參數$1所代表的字段內容;而后者直接顯示為1。因為1不是有效的位置參數,而只是把它當作一個簡單的字符來處理。
三、set命令的高級應用。
上面舉的例子其實只是set命令的一個教學例子。在實際工作中,這主要是用來讓大家理解set命令來截取輸出結果的基本原理。筆者現在要介紹的就是系統工程師在實際工作中經常要用到的內容,大家要睜開眼看仔細了。
1、從其他文件中或者不規則分隔符的結果中截取字段。如上面所示的輸出結果中,各個字段時通過空格符號來分隔的。也即是說,set命令使用的參數分隔符默認情況下采用的是空格符號分隔符。如果顯示的結果不是以空格符號分隔的,還是以分號或者橫桿來區分的(系統工程師平時遇到最多的就是利用分號或者/符號來分隔的內容),那么就不能利用這個命令了嗎?其實系統工程師可以根據實際情況來設置這個分隔符。也就是說,系統工程師可以利用這個set命令來操作位置參數,從而從任何輸出結果中(分隔符不同)截取所需要的內容。
2、有利于備份的工作。其實在備份作業中,這個特性就非常有用。如筆者在Unix系統上簡易部署了一個文件服務器。在這個服務器上,存儲有企業所有員工的日常工作文件。為此其日常的安全就顯得非常的重要。此時系統工程師可以采用日被分的方式,把備份文件保存為一個月。也就是說,在系統中創建1-31一共三十一個文件夾。然后把文件服務器中的備份文件按照日期一次保存到這三十一個文件夾中。也就是說1日的備份文件保存在文件夾名字為1的文件夾中,2日的備分文件備份到名字為2的文件夾中,依次類推。這個備份功能程序不難,系統工程師可以編寫一個腳本程序來完成。困難的是,系統如何根據當前的日期把備份文件保存到特定的文件夾中。此時就需要用刀這個set命令。系統工程師可以利用set命令來抽取系統日期中的第三個位置參數。然后根據這個參數創建文件夾(創建文件夾時,如果文件夾已經存在,則系統會自動覆蓋這個文件夾)。就是這么簡單,就可以完成按日來保存備份文件了??梢?,利用set命令截取某個輸出結果中的內容這是一個基礎性的功能。他跟其他命令或者程序結合則可以發揮意想不到的效果。為此筆者建議各位系統工程師,要牢記如何通過set命令來從輸出結果中截取必要的參數?;蛟S在什么時候就用的著了。另外需要注意的就是,set命令可以通過各種分隔符來截取相關的字段,而不僅僅只是支持一個空格分隔符,如可以從一個分號分隔的參數文件中獲取相關的參數等等。
