创建numpy数组时dtype = object是什么意思?
我正在尝试使用numpy数组并创建了一个numpy的字符串数组:
ar1 = np.array(['avinash', 'jay'])
正如我从他们的官方指南中所读到的那样,对numpy数组的操作会传播到各个元素。所以我这样做:
ar1 * 2
但是然后我得到这个错误:
TypeError Traceback (most recent call last)<ipython-input-22-aaac6331c572> in <module>()
----> 1 ar1 * 2
TypeError: unsupported operand type(s) for *: 'numpy.ndarray' and 'int'
但是当我使用 dtype=object
ar1 = np.array(['avinash', 'jay'], dtype=object)
创建数组时,我可以执行所有操作。
谁能告诉我为什么会这样吗?
回答:
NumPy数组存储为连续的内存块。它们通常具有单个数据类型(例如,整数,浮点数或固定长度的字符串),然后将内存中的位解释为具有该数据类型的值。
创建数组的dtype=object
方式有所不同。现在,数组占用的内存充满了 指向 Python对象的 指针 ,这些 指针 存储在内存中的
其他位置 (很像Pythonlist
实际上只是对象的指针列表,而不是对象本身)。
诸如此类的算术运算符*
不适ar1
用于具有string_
数据类型的数组(而是使用特殊函数-
参见下文)。NumPy只是将内存中的位视为字符,因此*
操作符在这里没有意义。但是,线
np.array(['avinash','jay'], dtype=object) * 2
之所以起作用,是因为该数组是Python字符串(指向)的数组。*
这些Python字符串对象的运算符定义明确。在内存中创建新的Python字符串,并object
返回引用了新字符串的新数组。
如果您有一个带有string_
或unicode_
dtype的数组,并且想重复每个字符串,则可以使用np.char.multiply
:
In [52]: np.char.multiply(ar1, 2)Out[52]: array(['avinashavinash', 'jayjay'],
dtype='<U14')
NumPy也有许多其他向量化字符串方法。
以上是 创建numpy数组时dtype = object是什么意思? 的全部内容, 来源链接: utcz.com/qa/435374.html