在Python中检测具有非英文字符的字符串

我有一些混合使用英语和没有英语字母的字符串。例如:

w='_1991_اف_جي2'

如何使用Regex或Python中的其他任何快速方法识别这些类型的字符串?

我不希望将字符串中的字母与字母列表一一比较,而要快速完成。

回答:

您只需检查字符串是否只能使用ASCII字符(拉丁字母+其他字符)进行编码。如果它不能被编码,则它具有来自其他字母的字符。

注意评论# -*- coding: ....。它应该在python文件的顶部(否则您会收到一些关于编码的错误)

# -*- coding: utf-8 -*-

def isEnglish(s):

try:

s.encode(encoding='utf-8').decode('ascii')

except UnicodeDecodeError:

return False

else:

return True

assert not isEnglish('slabiky, ale liší se podle významu')

assert isEnglish('English')

assert not isEnglish('ގެ ފުރަތަމަ ދެ އަކުރު ކަ')

assert not isEnglish('how about this one : 通 asfަ')

assert isEnglish('?fd4))45s&')

以上是 在Python中检测具有非英文字符的字符串 的全部内容, 来源链接: utcz.com/qa/409972.html

回到顶部