pandas在列中阅读带有额外逗号的csv
我正在读取一个基本的csv文件,其中这些列用逗号分隔,这些列名称分别为:
userid, username, body
但是,主体列是一个字符串,可能包含逗号。显然,这会导致问题,并且熊猫抛出错误:
CParserError: Error tokenizing data. C error: Expected 3 fields in line 3,
saw 8
有没有一种方法可以告诉熊猫忽略特定列中的逗号,或者可以解决该问题?
回答:
想象一下,我们正在读取名为的数据框comma.csv
:
userid, username, body01, n1, 'string1, string2'
您可以做的一件事是使用以下命令在列中指定字符串的定界符:
df = pd.read_csv('comma.csv', quotechar="'")
在这种情况下'
,以逗号分隔的字符串将被视为总数,而不管它们之间的逗号如何。
以上是 pandas在列中阅读带有额外逗号的csv 的全部内容, 来源链接: utcz.com/qa/397364.html