
Python中的模糊字符串匹配
我有2个超过一百万个名称的列表,它们的命名约定略有不同。目的是匹配具有95%置信度的逻辑的相似记录。我知道有些库可以利用,例如Python中的FuzzyWuzzy模块。但是,就处理而言,将一个列表中的每个字符串与另一个列表进行比较似乎会占用过多资源,在这种情况下,这似乎需要将100万乘以另一百...
2024-01-10
如何在Python中小写字符串?
有没有一种方法可以将字符串从大写,甚至部分大写转换为小写?例如,“公里”→“公里”。回答:用途.lower()-例如:s = "Kilometer"print(s.lower())官方2.x文档在这里: 官方3.x文档在这里:str.lower()](https://docs.python.org/2/library/stdtypes.html?highlight=str.lower#str.lower)[str.lower()...
2024-01-10
Python使用的字符串比较技术
我想知道Python如何进行字符串比较,更具体地说,当使用小于(<)或大于(>)运算符时,它如何确定结果。例如,如果我放进print('abc' < 'bac')去True。我知道它会比较字符串中的相应字符,但是由于缺乏更好的术语,不清楚为什么还有更多,“权重”是基于以下事实:在第一个字符串中a小于b(第一个...
2024-01-10
Python日期字符串到日期对象
如何在python中将字符串转换为日期对象?该字符串是:"24052010"(对应于格式:"%d%m%Y")我不想要datetime.datetime对象,而是想要datetime.date。回答:你可以strptime在datetimePython软件包中使用:>>> import datetime>>> datetime.datetime.strptime('24052010', "%d%m%Y").date()datetime.date(2010, 5, 24)...
2024-01-10
Python的 - 从字符串值为了
内印刷字典键我有这样的下面的代码:Python的 - 从字符串值为了d = {'one' : '11111111', 'two' : '01010101', 'three' : '10101010'} string = '01010101 11111111 10101010' text = '' for key, value in d.items(): if value in string: text += key print(text) 输出:onetwothree然而,我的期望了说就是...
2024-01-10
Python中的字符串比较:与==
我注意到我正在编写的Python脚本表现得很松散,并将其追溯到无限循环,其中循环条件为while line is not ''。在调试器中运行它,结果发现那条线实际上是''。当我将其更改为!=’‘而不是时is not '',它工作正常。另外,即使比较int或Boolean值,通常还是最好还是默认使用'=='吗?我一直喜欢使用'is',因为我...
2024-01-10
Python-压缩Ascii字符串
我正在寻找一种压缩基于ascii的字符串的方法,有帮助吗?我还需要解压缩它。我尝试了zlib,但没有帮助。如何将字符串压缩为较短的长度?码:def compress(request): if request.POST: data = request.POST.get('input') if is_ascii(data): result = zlib.compress(data) return render_to_response(...
2024-01-10
Python-从字符串变量导入模块
我正在编写有关matplotlib(MPL)嵌套库的文档(个人),该文档与感兴趣的子模块程序包所提供的MPL有所不同。我正在编写Python脚本,希望该脚本可以自动从将来的MPL版本中生成文档。我选择了感兴趣的子模块/程序包,并希望列出其主要类,然后从中生成列表并进行处理。pydoc问题是我找不到指示Python...
2024-01-10
python字符串前的ab前缀是什么意思?
在python源代码中,我偶然发现在类似如下的字符串之前有一个小b:b"abcdef"我知道u表示unicode字符串的r前缀和原始字符串文字的前缀。b它看起来像一个没有任何前缀的纯字符串,它代表什么?它在哪种源代码中有用?回答:这是Python3 bytes 文字。在Python 2.5和更早版本中,此前缀不存在(它等效于2.x...
2024-01-10
Python-将字符串打印到文本文件
我正在使用Python打开文本文档:text_file = open("Output.txt", "w")text_file.write("Purchase Amount: " 'TotalAmount')text_file.close()我想将字符串变量的值替换TotalAmount为文本文档。有人可以让我知道怎么做吗?回答:text_file = open("Output.txt", "w")text_file.write("Purchase Amount: %s" % TotalAmount)text...
2024-01-10
Python-如何将零填充到字符串?
用Python方式填充数字字符串的最左端方法是在其左侧添加零,即数字字符串具有特定的长度?回答:字符串:>>> n = '4'>>> print(n.zfill(3))004对于数字:>>> n = 4>>> print(f'{n:03}') # Preferred method, python >= 3.6004>>> print('%03d' % n)004>>> print(format(n, '03')) # python >= 2.6004>>> print('{0:03d}'.format(n)...
2024-01-10
Python-如何将变量放在字符串中?
我想int放入一个string。这是我目前正在做的事情:num = 40plot.savefig('hanning40.pdf') #problem line我必须为几个不同的数字运行程序,所以我想做一个循环。但是像这样插入变量不起作用:plot.savefig('hanning', num, '.pdf')如何在Python字符串中插入变量?回答:plot.savefig('hanning(%d).pdf' % num)当跟随字符串时,%运...
2024-01-10
Python如何确定两个字符串是否相同
我试图了解Python字符串何时相同(也就是共享相同的内存位置)。但是,在我的测试中,当两个相等的字符串变量共享相同的内存时,似乎没有明显的解释:import sysprint(sys.version) # 3.4.3# Example 1s1 = "Hello"s2 = "Hello"print(id(s1) == id(s2)) # True# Example 2s1 = "Hello" * 3s2 = "Hello" * 3print(id(s1) == id(s2)) # True# Exa...
2024-01-10
在Python中从字符串中剥离HTML
from mechanize import Browserbr = Browser()br.open('http://somewebpage')html = br.response().readlines()for line in html: print line当在HTML文件中打印一行时,我试图找到一种仅显示每个HTML元素的内容而不显示格式本身的方法。如果找到'<ahref="whatever.com">some text</a>',它将仅打印“某些文本”,'<b>hello</b>'打印“hell...
2024-01-10
Python-使用字符串变量作为变量名
我有一个分配了字符串的变量,我想根据该字符串定义一个新变量。foo = "bar"foo = "something else" # What I actually want is:bar = "something else"回答:你可以使用exec:>>> foo = "bar">>> exec(foo + " = 'something else'")>>> print barsomething else>>> ...
2024-01-10
Python strip()多个字符?
我想从字符串中删除任何括号。为什么这不能正常工作?>>> name = "Barack (of Washington)">>> name = name.strip("(){}<>")>>> print nameBarack (of Washington回答:我在这里进行了一次时间测试,每种方法循环使用了100000次。结果令我惊讶。(结果被编辑以响应评论中的有效批评后,仍然令我感到惊讶。)这是脚本:im...
2024-01-10
Python-如何检查字符串是否为空?
Python是否有类似空字符串变量的内容,你可以在其中执行以下操作:if myString == string.empty:无论如何,检查空字符串值的最优雅方法是什么?我”“每次都很难检查空字符串,因此很难进行编码。回答:空字符串是“虚假的”,这意味着它们在布尔上下文中被认为是错误的,因此你可以执行以下操作...
2024-01-10
Python两个相同的字符串被视为不同
我有两个字符串,它们看起来都一样:x1 = 'N C Soft - NCSOFT_Guild Wars 2 December 2013 :: BNLX_AD_Parallax_160x600'x2 = 'N C Soft - NCSOFT_Guild Wars 2 December 2013 :: BNLX_CT_Parallax_160X600'但是,检查相等性表明它们不是。In [312]: if x1 != x2: .....: print 'yep' .....:yep我还尝试从命令...
2024-01-10
解码Python字符串中的HTML实体?
我正在使用Beautiful Soup 3解析一些HTML,但是它包含HTML实体,Beautiful Soup 3不会自动为我解码:>>> from BeautifulSoup import BeautifulSoup>>> soup = BeautifulSoup("<p>£682m</p>")>>> text = soup.find("p").string>>> print text£682m如何解码HTML实体text以获得"£682m"而不是"£682m"。回答...
2024-01-10
Python-如何在文本文件中搜索字符串?
我想检查字符串是否在文本文件中。如果是,请执行X。否则,请执行Y。但是,True由于某些原因,此代码始终返回。谁能看到错在哪里?def check(): datafile = file('example.txt') found = False for line in datafile: if blabla in line: found = True breakcheck()if True: print "true"else: ...
2024-01-10
如何在Python中正确编写原始多行字符串?
我知道您可以通过以下几种方式创建多行字符串:'''This is a multi-linestring.'''('this is ''a string')'This is'\'a string'我也知道,在字符串前面加上前缀r将使它成为原始字符串,对于文件路径很有用。r'C:\Path\To\File'但是,我有一个长文件路径,该文件路径既跨越多行,又需要是原始字符串。我该...
2024-01-10
如何在Python中匹配精确的“多个”字符串
我有要在给定字符串中搜索的确切模式的列表。目前,对于这种问题,我有一个非常糟糕的解决方案。pat1 = re.compile('foo.tralingString')mat1 = pat1.match(mystring)pat2 = re.compile('bar.trailingString')mat2 = pat2.match(mystring)if mat1 or mat2: # Do whateverpat = re.compile('[foo|bar].tralingString')matc...
2024-01-10
如何从Python字符串中删除括号内的文本?
我想删除括号和驻留在这些括号中的文本以及连字符。一些字符串示例如下所示: example = 'Year 1.2 Q4.1 (Section 1.5 Report (#222))' example2 = 'Year 2-7 Q4.8 - Data markets and phases' ##there are two hyphens如何从Python字符串中删除括号内的文本?我想结果是:example = 'Year 1.2 Q4.1' example2 = 'Year 2-7 Q4.8' 如何删除文本居住...
2024-01-10
Python-查找两个字符串之间的相似性度量
如何获得字符串与Python中的另一个字符串相似的概率?我想要一个像0.9(表示90%)之类的十进制值。最好使用标准Python和库。例如similar("Apple","Appel") #would have a high prob.similar("Apple","Mango") #would have a lower prob.回答:有一个内置的。from difflib import SequenceMatcherdef similar(a, b): return SequenceMatche...
2024-01-10
在Python中找到一组字符串的最小汉明距离
我有一组n(〜1000000)个字符串(DNA序列)存储在列表trans中。我必须在列表中找到所有序列的最小汉明距离。我实现了一个幼稚的蛮力算法,该算法已经运行了一天多,并且尚未提供解决方案。我的代码是dmin=len(trans[0])for i in xrange(len(trans)): for j in xrange(i+1,len(trans)): dist=hamdist(trans[i][:-1], tra...
2024-01-10
