创建numpy数组时dtype = object是什么意思？

Z时代
2024-01-10
分类：问答

我正在尝试使用numpy数组并创建了一个numpy的字符串数组：

ar1 = np.array(['avinash', 'jay'])

正如我从他们的官方指南中所读到的那样，对numpy数组的操作会传播到各个元素。所以我这样做：

ar1 * 2

但是然后我得到这个错误：

TypeError                                 Traceback (most recent call last)
<ipython-input-22-aaac6331c572> in <module>()
----> 1 ar1 * 2
TypeError: unsupported operand type(s) for *: 'numpy.ndarray' and 'int'

但是当我使用 dtype=object

ar1 = np.array(['avinash', 'jay'], dtype=object)

创建数组时，我可以执行所有操作。

谁能告诉我为什么会这样吗？

回答：

NumPy数组存储为连续的内存块。它们通常具有单个数据类型（例如，整数，浮点数或固定长度的字符串），然后将内存中的位解释为具有该数据类型的值。

创建数组的dtype=object方式有所不同。现在，数组占用的内存充满了指向 Python对象的指针，这些指针存储在内存中的

其他位置 （很像Pythonlist实际上只是对象的指针列表，而不是对象本身）。

诸如此类的算术运算符*不适ar1用于具有string_数据类型的数组（而是使用特殊函数-

参见下文）。NumPy只是将内存中的位视为字符，因此*操作符在这里没有意义。但是，线

np.array(['avinash','jay'], dtype=object) * 2

之所以起作用，是因为该数组是Python字符串（指向）的数组。*这些Python字符串对象的运算符定义明确。在内存中创建新的Python字符串，并object返回引用了新字符串的新数组。

如果您有一个带有string_或unicode_dtype的数组，并且想重复每个字符串，则可以使用np.char.multiply：

In [52]: np.char.multiply(ar1, 2)
Out[52]: array(['avinashavinash', 'jayjay'], 
      dtype='<U14')

NumPy也有许多其他向量化字符串方法。

以上是创建numpy数组时dtype = object是什么意思？的全部内容，来源链接： utcz.com/qa/435374.html

创建numpy数组时dtype = object是什么意思？

回答：

其他人也看了：