如何使用Python在多个分隔符上拆分字符串?
问题
您需要将字符串拆分成多个字段,但是分隔符在整个字符串中并不一致。
解
您可以通过多种方式在python中拆分一个或多个分隔符的字符串。最简单的方法是使用该split()
方法,但是,它旨在处理简单的情况。
re.split() is more flexible than the normal `split()` method in handling complex string scenarios.
使用re.split()可以为分隔符指定多个模式。如解决方案中所示,分隔符为ahyphen(-)或whitespace()或逗号(,)后跟的值。正则表达式文档可以在这里找到。
每当找到该模式时,整个匹配都将成为匹配两侧的字段之间的分隔符。
仅提取定界符之间的文本(不定界符)。
示例
import retennis_greats = 'Roger-federer, Rafael nadal, Novak Djokovic,Andy murray'
""""
#-------------------------------------------------------------------------------------------
# Scenario 1 - Output the players
# Input - String with multiple delimiters ( - , white space)
# Code - Specify the delimters in []
#-------------------------------------------------------------------------------------------
"""
players = re.split(r'[-,\s]\s*',tennis_greats)
输出
print(f" The output is - {players}")
输出为-[“ Roger”,“ federer”,“ Rafael”,“ nadal”,“ Novak”,“ Djokovic”,“ Andy”,“ Murray”]
提取定界符之间的文本以及定界符
示例
import retennis_greats = 'Roger-federer, Rafael nadal, Novak Djokovic,Andy murray'
""""
#-------------------------------------------------------------------------------------------
# Scenario 2 - Output the players and the delimiters
# Input - String with multiple delimiters ( - , white space)
# Code - Specify the delimters between pipe (|)
#-------------------------------------------------------------------------------------------
"""
players = re.split(r'(-|,|\s)\s*',tennis_greats)
输出
print(f" The output is -{players}")
输出为-['Roger','-','federer',',','Rafael',','nadal',',','Novak',','Djokovic',',' ,“安迪”,“”,“墨累”]
以上是 如何使用Python在多个分隔符上拆分字符串? 的全部内容, 来源链接: utcz.com/z/326447.html