
在pandas中分配线条颜色
我试图在熊猫中绘制一些数据,并且内置的绘图功能可以方便地在每列中绘制一行。我要做的是根据我进行的分类为每行手动分配颜色。以下作品:df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2]})s = pd.Series(['c','y'], index=['1','2'])df.plot(color = s)但是,当我的索引是整数时,它将不再起作用并抛出为KeyError:...
2024-01-10
pandas从字符串中提取数字
给定以下数据框:import pandas as pdimport numpy as npdf = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], })df A0 1a1 NaN2 10a3 100b4 0b我想从每个单元格(存在的地方)中提取数字。理想的结果是: A0 11 NaN2 103 1004 0我知道可以用完成str.extract,但是我不确定如何做。回...
2024-01-10
如何删除pandas中的小数点
我有一个熊猫数据框df,看起来像这样:Cut-off <=35 >35 Calcium 0.0 1.0Copper 1.0 0.0Helium 0.0 8.0Hydrogen 0.0 1.0如何删除小数点,以便数据框如下所示:Cut-off <= 35 > 35 ...
2024-01-10
使用pandas比较两列
以此为起点:a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]df = pd.DataFrame(a, columns=['one', 'two', 'three'])Out[8]: one two three0 10 1.2 4.21 15 70 0.032 8 5 0我想if在熊猫中使用类似声明的内容。if df['one'] >= df['two'] and df['one'] ...
2024-01-10
在pandas数据框中选择多个列
我在不同的列中有数据,但是我不知道如何提取数据以将其保存在另一个变量中。index a b c1 2 3 42 3 4 5如何选择'a','b'然后将其保存到df1中?我试过了df1 = df['a':'b']df1 = df.ix[:, 'a':'b']似乎没有任何工作。回答:列名(字符串)无法按照你尝试的方式进行切片。在这里,你有两个...
2024-01-10
pandas过滤和比较日期
我有一个sql文件,其中包含以下数据,我将这些数据读入pandas中。df = pandas.read_sql('Database count details', con=engine, index_col='id', parse_dates='newest_available_date')id code newest_date_available9793708 3514 2015-12-249792282 2399 2015-12-259...
2024-01-10
如何在pandas中按数字获取列?
之间有什么区别:Maand['P_Sanyo_Gesloten']Out[119]: Time2012-08-01 00:00:11 02012-08-01 00:05:10 02012-08-01 00:10:11 02012-08-01 00:20:10 02012-08-01 00:25:10 02012-08-01 00:30:09 02012-08-01 00:40:10 02012-08-01 00:50:09 02012-08-01 01:05:...
2024-01-10
如何将多列乘以pandas中的一列
我想拥有:df[['income_1', 'income_2']] * df['mtaz_proportion']返回这些列乘以 df['mtaz_proportion']这样我可以设定df[['mtaz_income_1', 'mtaz_income_2']] = df[['income_1', 'income_2']] * df['mtaz_proportion']但是我得到了:income_1 income_2 0 1 2 3 4 5 6 7 8 9 ...
2024-01-10
日期时间毫秒到pandas秒
在pandas数据框中有一个datetime列,其值如下:time2018-04-11 22:18:30.1222018-04-11 23:00:21.399我想知道如何舍入这些值,摆脱毫秒,仅将日期,小时,分钟和00表示为秒,如下所示:time2018-04-11 22:18:002018-04-11 23:00:00回答:使用floor与T用于分钟设置0 seconds:#if necessary#df['time'] = pd.to_datetime(df['time'])df['time'] =...
2024-01-10
获取在pandas的各列中具有相同值的行
在pandas中,给定一个DataFrame D:+-----+--------+--------+--------+ | | 1 | 2 | 3 |+-----+--------+--------+--------+| 0 | apple | banana | banana || 1 | orange | orange | orange || 2 | banana | apple | orange || 3 | NaN | NaN ...
2024-01-10
如何在pandas中设置特定的单元格值?
我试图在pandas数据框中设置一个值。ZEROS = np.zeros((4,4), dtype=np.int)df = pd.DataFrame(ZEROS, columns=['A1','B1','C1','D1'])df.at[2,3] = 32df我不需要NaN整个专栏,预期的输出如下:使用numpy我可以像下面这样设置值ZEROS[1][3] = 44输出:array([[ 0, 0, 0, 0], [ 0, 0, 0, 44], [ 0, 0, 0, ...
2024-01-10
比较pandas数据框中的两列以创建第三列
我有以下数据框:In [25]: df1Out[25]: a b0 0.752072 0.8134261 0.868841 0.3546652 0.944651 0.7455053 0.485834 0.1637474 0.001487 0.8201765 0.904039 0.1363556 0.572265 0.2505707 0.514955 0.8683738 0.195440 0.4841609 0.506443 0.52...
2024-01-10
pandas在列中阅读带有额外逗号的csv
我正在读取一个基本的csv文件,其中这些列用逗号分隔,这些列名称分别为:userid, username, body但是,主体列是一个字符串,可能包含逗号。显然,这会导致问题,并且熊猫抛出错误:CParserError: Error tokenizing data. C error: Expected 3 fields in line 3,saw 8有没有一种方法可以告诉熊猫忽略特定列中的逗号,或者...
2024-01-10
在pandas中用NaN替换空白值(空白)
我想在包含空格(任意数量)的Pandas数据框中找到所有值,并用NaN替换这些值。有什么想法可以改善吗?基本上我想把这个: A B C2000-01-01 -0.532681 foo 02000-01-02 1.490752 bar 12000-01-03 -1.387326 foo 22000-01-04 0.814772 baz 2000-01-05 -0.222552 42000-01-06 -1.1...
2024-01-10
Draw and Guess中文输入方法详解
Draw and Guess怎么输入中文?Draw and Guess很需要输入文字才能游玩,但不少玩家都未能明白该怎么做,下面小编就带来Draw and Guess中文输入方法,一起来看看吧。Draw and Guess中文输入方法要输入中文的话,确保切换输入法为中文输入法,不是的话最好在游戏内切换,否则很容易是无效的。一般按shift是切换英...
2024-01-10
在Pandas中,groupby分组列消失后
我有以下名为ttm的数据框: usersidid clienthostid eventSumTotal LoginDaysSum score0 12 1 60 3 17281 11 1 240 3 13313 5 1 5...
2024-01-10
将包含多行JSON的文件加载到Pandas中
我正在尝试将JSON文件读入Python熊猫(0.14.0)数据帧中。这是JSON文件的第一行:{"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandw...
2024-01-10
检查单个单元格值在pandas中是否为NaN
我只想检查Pandas系列中的单个单元格是否为null,即检查值是否为NaN。所有其他答案适用于序列和数组,但不适用于单个值。我已经试过pandas.notnull,pandas.isnull,numpy.isnan。是否只有一个单一值的解决方案?回答:尝试这个:import pandas as pdimport numpy as npfrom pandas import *>>> L = [4, nan ,6]>>> df = Series(L)...
2024-01-10
如何在Pandas中合并两个专属列?
我有两列,这些列是独占的。 如果column1中第i行的条目是NaN,我想用第2列中的任何内容替换NaN。如何快速完成而无需迭代所有行?如何在Pandas中合并两个专属列?回答:你可以做类似df.loc[df.column1.isnull(), 'column1'] = df.column2 或可替代(这可能是更好的性能),df.column1 = np.where(df.column1.isnull(), df.colum...
2024-01-10
如何将pandas数据框中的每一行乘以不同的值
我试图用不同的值乘以pandas数据框的每一行,并想知道这样做的最佳方法是什么。例如,如果我具有以下数据框:import numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(2, 3))df 0 1 20 -1.283316 0.849488 1.9360601 -2.078575 -0.871570 -0.970261我想将每行的每个元素乘以列表或数组中的...
2024-01-10
pandas - 在新列中聚集列的一部分到新值
我有一个大的pandas数据框df,仓库数据显示接收到的项目数量。pandas - 在新列中聚集列的一部分到新值想象结构的相关部分为:Date SKU received 2017-05-29 sku1 0 2017-05-30 sku1 0 2017-05-31 sku1 0 2017-06-01 sku1 0 2017-06-02 sku1 6 2017-06-03 sku1 2 2017-05-29 sku2 4 2017-05-30 sku2 4 2017-05-31 sku2 0 2017-06...
2024-01-10
Python-pandas:如何将一列中的文本分成多行?
我正在处理一个较大的csv文件,并且最后一列的旁边是一串文本,我想用一个特定的定界符来分割它。我想知道是否有使用pandas或python的简单方法?CustNum CustomerName ItemQty Item Seatblocks ItemExt32363 McCartney, Paul 3 F04 2:218:10:4,6 6031316 Lennon, John ...
2024-01-10
pandas获得两列或更多列的行最小值
如何作为熊猫数据框方程的一部分引用两个数据框的最小值?我尝试使用min()无法正常工作的python函数。很抱歉,如果在某处有充分的文档证明,但无法找到有效的解决方案来解决此问题。我正在寻找与此类似的东西:data['eff'] = pd.DataFrame([data['flow_h'], data['flow_c']]).min() *Cp* (data[' Thi'] - data[' Tci'])我也尝...
2024-01-10
根据列名称对pandas数据框中的列进行重新排序
我有dataframe超过200列。问题是当它们生成时,订单是['Q1.3','Q6.1','Q1.2','Q1.1',......]我需要重新排列列,如下所示:['Q1.1','Q1.2','Q1.3',.....'Q6.1',......]有什么办法可以让我在Python中执行此操作吗?回答:df = df.reindex(sorted(df.columns), axis=1)假定对列名称进行排序将给出所需的顺序。如果您的列名不会按字典...
2024-01-10
如何使用pandas对符合给定条件的列中的值求和?
假设我有一个像这样的列:a b 1 5 1 72 31 32 5例如,我想总结bwhere的值a = 1。这会给我5 + 7 + 3 = 15。如何在熊猫中做到这一点?回答:这里的基本思想是选择要求和的数据,然后将它们求和。可以通过几种不同的方式来选择数据,以下显示了其中几种。回答:可以说,选择值的最常见方...
2024-01-10
