不区分大小写的pandas dataframe.merge
我正在用最简单的方法在熊猫中进行不区分大小写的合并。有没有一种方法可以正确地在合并?我是否需要使用(?i)或带有ignorecase的正则表达式?在下面的代码段中,我加入了一些国家,其中一个文件中可能是“美国”,另一个文件中可能是“美国”,我只是想把这种情况排除在外。谢谢!
import pandas as pdimport csv
import sys
env_path = sys.argv[1]
map_path = sys.argv[2]
df_address = pd.read_csv(env_path + "\\address.csv")
df_CountryMapping = pd.read_csv(map_path + "\CountryMapping.csv")
df_merged = df_address.merge(df_CountryMapping, left_on="Country", right_on="NAME", how="left")
....
回答:
将用于合并的两列中的值小写,然后在小写列中合并
df_address['country_lower'] = df_address['Country'].str.lower()df_CountryMapping['name_lower'] = df_CountryMapping['NAME'].str.lower()
df_merged = df_address.merge(df_CountryMapping, left_on="country_lower", right_on="name_lower", how="left")
以上是 不区分大小写的pandas dataframe.merge 的全部内容, 来源链接: utcz.com/qa/403830.html