- 限定符
- ?:代表前一个字符出现0或1次
- * :代表前一个字符出现0次或多次
- + :代表前一个字符出现1次以上
- :代表前面一个字符出现x次
- {l, r} :代表前一个字符出现[l, r]次
- {l, } : 代表前一个字符出现l次以上
- () :将括号中的内容看成整体再使用以上的限定符
- 或运算符
- (x|y) :匹配x或者y
- 字符类
- [abc]+ :[abc]代表匹配的字符只能取自abc,+代表必须出现过
- [a-z]+ :匹配所有小写英文字符
- [a-zA-Z] :匹配所有英文字符
- [a-zA-Z0-9] :匹配所有英文字符和数字
- ^(脱字符):[^0-9]+代表所有的非数字字符
- 元字符
- \d+ :数字字符
- \w+ :单词字符(英文、数字、下划线)
- \s+ :空白字符(包含Tab和换行符)
- \D+ :非数字字符
- \W+ :非单词字符
- . : 代表任意字符
- \b :标注字符边界
- ^ :匹配行首(^a)
- $ :匹配行尾(a$)
贪心懒惰匹配:
<.+>(.+会贪心匹配)转化为<.+?>后变为懒惰匹配
测试网站:
https://regex101.com/