Python 正则表达式:split
发表于:2024-11-30 作者:热门IT资讯网编辑
编辑最后更新 2024年11月30日,作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表复杂匹配 = re.compile(正则表达式): 将
作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。
本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表
复杂匹配 = re.compile(正则表达式): 将正则表达式实例化
+
re.split(要匹配的字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
简单匹配 = re.split(正则表达式, 要匹配的原字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
懒癌,配上模块函数解释好消化
re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;第一个参数:正则表达式第二个参数:要匹配查找的原始字符串;第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;需要特别注意的是,这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'例如: re.split('z', 'p.python.p')返回值为['p.python.p']; #失败返回原string列表 re.split('p', 'p.python.p')返回值为['', '.', 'ython.', ''] #成功返回新列表
方法一:
对象名1 = re.split(正则表达式, 要匹配的原字符串)
#!/usr/bin/python# -*- coding: utf-8 -*-import os,re;pattern = r'[?|&]'string = "https://www.baidu.com/baidu?&ie=utf-8&word=51cto"result = re.split(pattern, string)print('Match:',result)
运行结果:
Match: ['https://www.baidu.com/baidu', '', 'ie=utf-8', 'word=51cto']