Python-将字符串拆分为具有多个单词边界分隔符的单词

我想做的是一项相当普通的任务,但我在网络上找不到任何参考。我的文字带有标点符号,我想要一个单词列表。

"Hey, you - what are you doing here!?"

应该

['hey', 'you', 'what', 'are', 'you', 'doing', 'here']

但是Python str.split()只能使用一个参数,因此在用空格分割后,所有单词都带有标点符号。有任何想法吗?

回答:

正则表达式合理的情况:

import re

DATA = "Hey, you - what are you doing here!?"

print re.findall(r"[\w']+", DATA)

# Prints ['Hey', 'you', 'what', 'are', 'you', 'doing', 'here']

以上是 Python-将字符串拆分为具有多个单词边界分隔符的单词 的全部内容, 来源链接: utcz.com/qa/432449.html

回到顶部