Python中文本模式与字符串的使用方法-创新互联-乐山大橙子建站

新闻中心

这里有您想知道的互联网营销解决方案

Python中文本模式与字符串的使用方法-创新互联

本篇文章给大家分享的是有关Python中文本模式与字符串的使用方法，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。

创新互联自2013年起，先为霞浦等服务建站，霞浦等地企业，进行企业商务咨询服务。为霞浦企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

一、你想在字符串中搜索和匹配指定的文本模式

遗漏点：re模块其实也是帮助我们进行字符串处理的重要工具，我之前总是想着用内建的函数来处理，其实如果是复杂的文本和数据结构，re模块能帮助我们处理很多信息。

对于简单的字面模式，直接使用 str.replace() 方法即可，比如：

>>> text = 'yeah, but no, but yeah, but no, but yeah'
>>> text.replace('yeah', 'yep')
'yep, but no, but yep, but no, but yep'
>>>

对于复杂的模式，请使用 re 模块中的 sub() 函数。为了说明这个，假设你想将形式为 11/27/2012 的日期字符串改成 2012-11-27 。示例如下：

>>> text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
>>> import re
>>> re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)
'Today is 2012-11-27. PyCon starts 2013-3-13.'

二、你需要以忽略大小写的方式搜索与替换文本字符串

为了在文本操作时忽略大小写，你需要在使用 re 模块的时候给这些操作提供 re.IGNORECASE 标志参数。比如：

>>> text = 'UPPER PYTHON, lower python, Mixed Python'
>>> re.findall('python', text, flags=re.IGNORECASE)
['PYTHON', 'python', 'Python']
>>> re.sub('python', 'snake', text, flags=re.IGNORECASE)
'UPPER snake, lower snake, Mixed snake'

最后的那个例子揭示了一个小缺陷，替换字符串并不会自动跟被匹配字符串的大小写保持一致。为了修复这个，你可能需要一个辅助函数，就像下面的这样：

def matchcase(word):
  def replace(m):
    text = m.group()
    if text.isupper():
      return word.upper()
    elif text.islower():
      return word.lower()
    elif text[0].isupper():
      return word.capitalize()
    else:
      return word
  return replace

当前标题：Python中文本模式与字符串的使用方法-创新互联
文章位置：http://lswzjz.com/article/cdgdhh.html

新闻中心

其他资讯