Python-将字符串拆分为具有多个单词边界分隔符的单词
我想做的是一项相当普通的任务,但我在网络上找不到任何参考。我的文字带有标点符号,我想要一个单词列表。
"Hey, you - what are you doing here!?"
应该
['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
但是Python str.split()
只能使用一个参数,因此在用空格分割后,所有单词都带有标点符号。有任何想法吗?
回答:
正则表达式合理的情况:
import reDATA = "Hey, you - what are you doing here!?"
print re.findall(r"[\w']+", DATA)
# Prints ['Hey', 'you', 'what', 'are', 'you', 'doing', 'here']
以上是 Python-将字符串拆分为具有多个单词边界分隔符的单词 的全部内容, 来源链接: utcz.com/qa/432449.html