不区分大小写的pandas dataframe.merge

我正在用最简单的方法在熊猫中进行不区分大小写的合并。有没有一种方法可以正确地在合并?我是否需要使用(?i)或带有ignorecase的正则表达式?在下面的代码段中,我加入了一些国家,其中一个文件中可能是“美国”,另一个文件中可能是“美国”,我只是想把这种情况排除在外。谢谢!

import pandas as pd

import csv

import sys

env_path = sys.argv[1]

map_path = sys.argv[2]

df_address = pd.read_csv(env_path + "\\address.csv")

df_CountryMapping = pd.read_csv(map_path + "\CountryMapping.csv")

df_merged = df_address.merge(df_CountryMapping, left_on="Country", right_on="NAME", how="left")

....

回答:

将用于合并的两列中的值小写,然后在小写列中合并

df_address['country_lower'] = df_address['Country'].str.lower()

df_CountryMapping['name_lower'] = df_CountryMapping['NAME'].str.lower()

df_merged = df_address.merge(df_CountryMapping, left_on="country_lower", right_on="name_lower", how="left")

以上是 不区分大小写的pandas dataframe.merge 的全部内容, 来源链接: utcz.com/qa/403830.html

回到顶部