python拆分中英文混合字符串按中文拆分

python

出自群里的提问,试了几次就实现了,现在分享出来。

#coding=utf-8

import re

s = "hi新手oh".decode("utf-8") #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码

p = re.compile(ur"[u4e00-u9fa5]") #这里是精髓,[u4e00-u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur

print p.split(s) #使用re库的split切割


以上是 python拆分中英文混合字符串按中文拆分 的全部内容, 来源链接: utcz.com/z/522707.html

回到顶部