pandas在列中阅读带有额外逗号的csv

我正在读取一个基本的csv文件,其中这些列用逗号分隔,这些列名称分别为:

userid, username, body

但是,主体列是一个字符串,可能包含逗号。显然,这会导致问题,并且熊猫抛出错误:

CParserError: Error tokenizing data. C error: Expected 3 fields in line 3,

saw 8

有没有一种方法可以告诉熊猫忽略特定列中的逗号,或者可以解决该问题?

回答:

想象一下,我们正在读取名为的数据框comma.csv

userid, username, body

01, n1, 'string1, string2'

您可以做的一件事是使用以下命令在列中指定字符串的定界符:

df = pd.read_csv('comma.csv', quotechar="'")

在这种情况下',以逗号分隔的字符串将被视为总数,而不管它们之间的逗号如何。

以上是 pandas在列中阅读带有额外逗号的csv 的全部内容, 来源链接: utcz.com/qa/397364.html

回到顶部