导航：首页 > 网络技术 >

Python- re模块

发表于：2024-11-29 作者：热门IT资讯网编辑

编辑最后更新 2024年11月29日，> re 模块正则表达式（或 RE）是一种小型的、高度专业化的编程语言，（在Python中）它内嵌在Python中，并通过 re 模块实现。正则表达式模式被编译成一系列的字节码，然后由用 C 编写的匹

> re 模块

正则表达式（或 RE）是一种小型的、高度专业化的编程语言，（在Python中）它内嵌在Python中，并通过 re 模块实现。正则表达式模式被编译成一系列的字节码，然后由用 C 编写的匹配引擎执行。

字符匹配：普通字符、元字符

1、普通字符类似精确匹配：

re.findall()第一个参数是规则，第二个参数是匹配的字符串。

2、元字符

元字符：*. ^ $ + ? { } [ ] | ( ) **

1、. 一个点号代表一个任意字符，多个代表多个。不包括换行符号（\n , \t , \r）

2、^ 开头符号（^a :表示匹配以a开头字符串）

3、$ 结尾符号（a$: 表示匹配以a结尾的字符串）

4、* 星号代表匹配 0到无穷次

5、+ 代表匹配 1 到无穷次

6、？代表匹配 0 到 1次

7、{} {0，1} 这样写代表匹配0到1次，{2，8}代表匹配2到8次

8、[] 这个中括号是 字符集 的意思。例：k[yc] 表示匹配 ky 或 kc '或'的意思

字符集里面可以应用3个符号： - . ^ . \ ，除了这三个符号，其余符号都代表是字符

加个 - 符号：
加个 ^ 符号，'非' 的意思：

字符集加 \ 跟元字符效果一样，（转义符）

**元字符之转义符\

反斜杠后边跟元字符去除特殊功能,比如.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d 匹配任何十进制数；它相当于类 [0-9]。
\D 匹配任何非数字字符；它相当于类 [^0-9]。
\s 匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9]。
\W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9]
\b 匹配一个特殊字符边界，比如空格，&，＃等