vi 中的正则表达式 (Regular Expression)

3/8/2008来源:C/C++教程人气:6243

.1. 定义和例子
============
  正则表达式只是一个字符模板,用来在搜索中匹配相同的字符.
在大多数的程序中,正则表达式是括在正斜杠中间的.
例如, /love/就是一个以正斜杠为分隔符的正则表达式,其中的
模板love 将用在搜索所有行中与它匹配的字符. 更为有趣的是
正则表达式可以被非凡的元字符控制.让我们通过下面的例子来进
一步了解这个概念.
  有文本如下:
  Hi tom,
  I think I failed my anatomy test yesterday. I
  had a terrible stomach ache. I ate too many
  fried green tomatoes.
  Anyway, Tom, Ineed your help. I'd like to make
  the test up tomorrow, but don't know where to
  begin studying. Do you think you could help me?
  After work, about 7 PM, come to my place and I'll
  treat you to pizza in return for your help.
  Thanks.
            Your pal,
            [email protected]

  假设你发觉Tom 并没有参加考试,而是David 参加的考试.同时还
发现, 在贺信中Tom的T用的是小写.于是你决定做一个全文替换,把tom
替换为Tom.

在vi命令行模式下输入:
:1, $s/tom/David/g
 ^   ^  ^    ^   ^
             ---- global 对全文有效
         
        --------- 将tom 替换为 David , 使用正则表达式.
    ------- 替换单词
 ------ 从文件的第一行到文件的最后一行.

 替换后的文本如下:
 Hi David,
 I think I failed my anaDavidy test yesterday, I
 had terible sDavidach ache. I ate too many
 fried green Davidatoes.
 Anyway, David, I need your help. I'd like to make
 the test up Davidorrow, but don't know where to
 begin studying. Do you think you could help me?
 After work, about ? PM, come to my place and
 I'll treat you to pizza in return for your help.
 Thanks.
                 Your pal,
                 [email protected]
 
 我们发现有些单词中含有tom的的也被替换了.
 这是因为我们没有使用正则表达式的元字符来界定一个模板从而控制
 字符的替换动作.
 使用:
 :1, $s/\<[Tt]om\>/David/g
 就可以得到我们想要的结果了,即只替换单词tom而不是含有tom字符的
 单词. 2. 正则表达式的元字符
==================
  正则表达式的元字符是一些非凡的字符,它们答应你以某种方式界定一个
模板来控制什么样的替换将发生.有的元字符锚定一个单词在行首或者行尾.
有的元字符答应你指定一个字符范围或者一些字符, 来找到大写字母, 小写字母
数字或者非数字等.

  有两套正则表达式字符集, 一套是基本元字符集, 另一套是扩展元字符集.
另外, POSIX (Portable Operating System Interface for Computer Eaviron ment)
标准还提供了一套元字符集.下表提供了可以在所有版本的vi, grep, egrep, sed and gawk
中使用的基本元字符集.
  表:
----------------------------------------------------------------------------------------------
  元字符       功能              例子           匹配什么
  ----------------------------------------------------------------------------------------------
  ^       锚定行的开始          /^love/     匹配所有以love开头的行.
  ----------------------------------------------------------------------------------------------
  $       锚定行的结束          /love$/     匹配所有以love结束的行.
  ----------------------------------------------------------------------------------------------
  .       匹配一个字符          /l..e/     匹配这样的行, 这些行包含这样的字符,
                        第一个字符是 l,紧跟着两个字符,然后是e.
  -----------------------------------------------------------------------------------------------
  *       代表0个或多个先前字符       /*love/     匹配这样的行, 有0个或者多个空格,空格
                        候跟着love
  -----------------------------------------------------------------------------------------------
  []       匹配字符组中的一个字符       /[lL]ove/     匹配所有包含love or Love 的行
  -----------------------------------------------------------------------------------------------
  [x-y]       匹配以字符范围组成的组中的一个字符    /[A-Z]ove     匹配所有这样的行, 这些行包含如下字符
                        第一个字符是从A到Z 中间的一个, 后面跟
                        着ove
  -----------------------------------------------------------------------------------------------
  [^]       匹配一个不在范围内的字符       /[^A-Z]ove/     匹配所有这样的行, 这些行包含如下字符
                        第一个字符不是从A到Z 中间的一个, 后面
                        跟着ove
  -----------------------------------------------------------------------------------------------
  \       用来转义一个字符          /love\./     匹配所有这样的行, 这些行包含如下字符
                        love 后面跟着一个点, 通常点是表示任何
                        字符的通配符.
  -----------------------------------------------------------------------------------------------
  \<        锚定单词的开始          /\<love/     匹配所有这样的行, 这些行包含以love
                        开头的单词 (vi & grep 都支持这个功能)
  -----------------------------------------------------------------------------------------------
  \>       锚定单词的结束          /<love\>     ... ^ ... 以love结束的单词 ... ^
  -----------------------------------------------------------------------------------------------
  \(..\)    标记后面用到的匹配字符       /\(love\)a\1b 最多可以使用9个标签. 第一个标签是模板
                        最左边的部分. 在这例子中, 模板love
                        保存为标签1, 后面的\1指的就是love;
                        本例子搜索的是这样的行, 这些行包含这样
                        的字符,在lovea 后面跟着loveb.
 ------------------------------------------------------------------------------------------------
 [NOTE: 各种版本的Unix 以及模板匹配 (pattern-matching) 实用程序并不都是可信赖的, 通常我们使用 vi & grep]

假设你熟悉 vi 是怎样工作的, 每一个元字符都在 vi 搜索字符串的术语中有具体描述.
 下面的例子中, 被加重的字符就是 vi 将找到的匹配字符.
 
 文本如下:
 I had a lovely time on our little picnic.
 Lovers were all around us. It is sPRingtime. Oh
 Love, how mUCh I adore you. Do you know
 the extent of my love? Oh, by the way, I think
 I lost my gloves somewhere out in that field of
 clover. Did you see them? I can only hope love
 is forever. I live for you. It's hard to get back
 in the groove.
 ~
 ~
 ~
 /love/

 结果如下:
 I had a lovely time on our little picnic.
      ^
 Lovers were all around us. It is springtime. Oh
    ^
 Love, how much I adore you. Do you know
   ^
 the extent of my love? Oh, by the way, I think
                    ^
 I lost my gloves somewhere out in that field of
              ^
 clover. Did you see them? I can only hope love
    ^                                        ^
 is forever. I live for you. It's hard to get back
 in the groove.
   
 //
 还有一些测试命令如下:
 /^love/
 /love$/
 /l.ve/
 /[lL]ove/
 /ove[a-z]/
 /ove[^a-zA-Z0-9]/

 //
 //:~ Tue 22 Apr 2003 11:42:51 PM CST
 //:~ End Of PAGE 1