从一个数据框中创建一个以一列值为参考的数组

Z时代
2024-01-10
分类：问答

我前几天正在处理这个问题，但是我找不到答案。希望您能够帮助我。从一个数据框中创建一个以一列值为参考的数组

这是我的数据框：

Date Attribute Quantity 0 2017-12-14 large -39 0 2017-12-15 large -80 1 2017-12-15 large -30 2 2017-12-14 short -15 2 2017-12-15 short -100 4 2017-12-15 short -10 1 2017-12-15 short 20 3 2017-12-15 short 60 3 2017-12-15 big 80 5 2017-12-15 big 104

我要做些什么？我想为每个Attribute系统计算XIRR。为此，我需要Date和Quantity（作为数组），但是基于第二列中列出的每个Attribute项目。例如，给出large，我想为large提取Dates和quantities（作为数组）。

鉴于此，我认为我的最佳选择是基于Attibute列创建特定数组，然后执行上述功能（请告诉我，如果考虑另一种解决此问题的方法）。于是，我产生一个阵列df1= df[['Date','Quantity']].as_matrix()其产生

[[Timestamp('2017-12-14 00:00:00') -39] 
[Timestamp('2017-12-15 00:00:00') -80] 
[Timestamp('2017-12-15 00:00:00') -30] 
[Timestamp('2017-12-14 00:00:00') -15] 
[Timestamp('2017-12-15 00:00:00') -100] 
[Timestamp('2017-12-15 00:00:00') -10] 
[Timestamp('2017-12-15 00:00:00') -20] 
[Timestamp('2017-12-15 00:00:00') 60] 
[Timestamp('2017-12-15 00:00:00') -80] 
[Timestamp('2017-12-15 00:00:00') 104]]

正如你可以看到这个阵列包括所有的属性，但我想根据Attribute列各attibute要达到这样的For/each功能。我怎样才能做到这一点？这是我最终目标的最佳方法吗？

任何帮助将不胜感激。

PD：我应该提一下，我想使用属性作为一个组的作品（因为它需要日期和数量，所有的一起）。它的工作原理类似于gruopby。

感谢

回答：

考虑将函数应用于数据帧中的每一行：

def row_func(row): 
    if row['Atribute'] == 'large': 
     return row['quantity'] 
    etc... 
df['new_column'] = df.apply(row_func, axis=1)

以上是从一个数据框中创建一个以一列值为参考的数组的全部内容，来源链接： utcz.com/qa/266471.html

从一个数据框中创建一个以一列值为参考的数组

回答：

其他人也看了：