正则表达式:在 Vim 中异于 Javascript 的用法
对于前后端各种编程语言中的正则表达式,开发者们已经再熟悉不过了;但如果你在使用 vim 编辑器,同样会在命令模式下遇到需要用正则实现搜索替换的情景。
往往在此时你会发现,这里的正则语法和 Javascript 等语言中虽然大部分相同,但还是有些差异,用起来处于一种 “会,但不完全会” 的奇怪叠加态。
今天我们就来稍微归纳一下 vim 中较独特的正则语法,为更好地使用这种编辑神器厘清障碍。
本文适用于较熟悉正则表达式和 vim 编辑器的读者,入门选手推荐先阅读以下文章:
搜索和替换标记
除了 g
、i
之外,在 vim 中还可以使用 c
,用来交互式地对匹配项逐个替换。
比如在命令模式下输入 :%s/cat/Dog/gc
后回车,会得到一个 replace with Dog (y/n/a/q/l/^E/^Y)?
的提示,按 y
就表示 yes 替换,按 n
表示 no 跳过等
贪婪模式和懒惰模式
贪婪模式:
*
匹配前面的字符 0 次或多次\+
匹配前面的字符 1 次或多次\?
或\=
匹配前面的字符 0 次或 1 次\{number}
精确匹配指定次数\{min,max}
匹配前面的字符最少 min 次或最多 max 次
非贪婪模式:
\{-}
匹配前面的字符 0 次或多次,比如对于字符串 'This is a sample text':/h.\{-}s
会匹配到 'his'/h.*s
则匹配到 'his is a s'\{-min,max}
尽可能少地匹配 min 次到 max 次,也就是满足条件情况下能 min 尽量不 max
特殊字符
除了常见的 \s
、\W
等,vim 中一些独特的字符匹配如下:
\a
匹配字母,即[a-zA-Z]
\A
匹配非字母,即[^a-zA-Z]
\l
匹配小写字母,即[a-z]
\L
匹配非小写字母,即[^a-z]
\u
匹配大写字母,即[A-Z]
\U
匹配非大写字母,即[^A-Z]
\x
匹配十六进制字符,即[0-9a-fA-F]
\X
匹配非十六进制字符,即[^0-9a-fA-F]
多匹配和捕获模式
\|
可以用来匹配两个或更多个关键词比如 /abc\|123
会匹配到 'abc' 或 '123'\(pattern\)
可以建立捕获分组,在替换段落中则用\1
,\2
依次表示捕获到的分组
单词边界
\<pattern
匹配单词的开始边界pattern\>
匹配单词的结束边界\<pattern\>
精确匹配整个单词
搜索模式调整符
\v
用来简化限定符、分组等里面的\
符号/\vc{5}
精确匹配 'ccccc'/\vabc+
匹配 'abc' 或 'abccc'/\vabc?
匹配 'ab' 或 'abc'/\v<his>
精确匹配整个单词 'his'/\vmin|max
匹配 'min' 或 'max'/\vhand(y|ful)
匹配 'handy' 或 'handful'/\v(\a)\1
匹配 'aa' 'bb' 'cc' 等s/\v(\d+) (\d+)/\2 \1/
将 '123 99' 替换为 '99 123'\V
使得匹配特殊字符时不用\
符号/V^.*$
精确匹配字符串^.\*$
\c
忽略大小写搜索\C
大小写敏感搜索\%V
只对可视模式下光标选中的范围进行替换s/\%Vcat/dog/g
会把选中范围内的 'cat' 换成 'dog'在可视模式按 ESC 变为命令模式时,命令输入行会自动生成 '<,'>
,要先删去这一部分
替换并改变大小写
在替换段落中,可以使用以下符号
\u
将后面的一个字符变为大写:% s/\v(\a+)/\u\1/g
会将文件中的所有英文单词变为首字母大写:% s/\v(\w)_(\a+)/\1\u\2/g
array_sum
变成 'arraySum'\U
将后面的所有字符变为大写:% s/\v(\a+)/\U\1/g
会将文件中的所有英文单词变为全大写\l
将后面的一个字符变为小写\L
将后面的所有字符变为小写
自定义分隔符
为了避免在搜索替换时使用过多的 /
所造成的混乱,可以使用诸如 #^$
这样的其他符号替换 /
,比如:
:% s#/project/adder/#/verilog/project/high_speed_adder/#g
参考资料
https://learnbyexample.gitbooks.io/vim-reference/content/Regular_Expressions.html
评论