Python标准库array高效的数值数组
此模块定义了一种对象类型,可以紧凑地表示基本类型值的数组:字符、整数、浮点数等。 数组属于序列类型,其行为与列表非常相似,不同之处在于其中存储的对象类型是受限的。 类型在对象创建时使用单个字符的 类型码 来指定。 已定义的类型码如下:
类型码 | C 类型 | Python 类型 | 以字节表示的最小尺寸 | 注释 |
---|---|---|---|---|
| signed char | int | 1 | |
| unsigned char | int | 1 | |
| Py_UNICODE | Unicode 字符 | 2 | (1) |
| signed short | int | 2 | |
| unsigned short | int | 2 | |
| signed int | int | 2 | |
| int | 2 | ||
| signed long | int | 4 | |
| unsigned long | int | 4 | |
| signed long long | int | 8 | |
| unsigned long long | int | 8 | |
| float | float | 4 | |
| double | float | 8 |
注释:
'u'
类型码对应于 Python 中已过时的 unicode 字符 (Py_UNICODE
即wchar_t
)。 根据系统平台的不同,它可能是 16 位或 32 位。'u'
将与其它的Py_UNICODE
API 一起被移除。Deprecated since version 3.3, will be removed in version 4.0.
值的实际表示会由机器的架构决定(严格地说是由 C 实现决定)。 实际大小可通过 itemsize
属性来获取。
这个模块定义了以下类型:
class
array.
array
(typecode[, initializer])¶一个包含由 typecode 限制类型的条目的新数组,并由可选的 initializer 值进行初始化,该值必须为一个列表、bytes-like object 或包含正确类型元素的可迭代对象。
如果给定一个列表或字符串,该 initializer 会被传给新数组的
fromlist()
,frombytes()
或fromunicode()
方法(见下文)以将初始条目添加到数组中。 否则会将可迭代对象作为 initializer 传给extend()
方法。
array.
typecodes
¶一个包含所有可用类型码的字符串。
数组对象支持普通的序列操作如索引、切片、拼接和重复等。 当使用切片赋值时,所赋的值必须为具有相同类型码的数组对象;所有其他情况都将引发 TypeError
。 数组对象也实现了缓冲区接口,可以用于所有支持 字节类对象 的场合。
以下数据项和方法也受到支持:
array.
typecode
¶用于创建数组的类型码字符。
array.
itemsize
¶在内部表示中一个数组项的字节长度。
array.
append
(x)¶添加一个值为 x 的新项到数组末尾。
array.
buffer_info
()¶返回一个元组
(address,length)
以给出用于存放数组内容的缓冲区元素的当前内存地址和长度。 以字节表示的内存缓冲区大小可通过array.buffer_info()[1]*array.itemsize
来计算。 这在使用需要内存地址的低层级(因此不够安全) I/O 接口时会很有用,例如某些ioctl()
操作。 只要数组存在并且没有应用改变长度的操作,返回数值就是有效的。注解
当在 C 或 C++ 编写的代码中使用数组对象时(这是有效使用此类信息的唯一方式),使用数组对象所支持的缓冲区接口更为适宜。 此方法仅保留用作向下兼容,应避免在新代码中使用。 缓冲区接口的文档参见 缓冲协议。
array.
byteswap
()¶“字节对调”所有数组项。 此方法只支持大小为 1, 2, 4 或 8 字节的值;对于其他值类型将引发
RuntimeError
。 它适用于从不同字节序机器所生成的文件中读取数据的情况。
array.
count
(x)¶返回 x 在数组中的出现次数。
array.
extend
(iterable)¶将来自 iterable 的项添加到数组末尾。 如果 iterable 是另一个数组,它必须具有 完全 相同的类型码;否则将引发
TypeError
。 如果 iterable 不是一个数组,则它必须为可迭代对象并且其元素必须为可添加到数组的适当类型。
array.
frombytes
(s)¶添加来自字符串的项,将字符串解读为机器值的数组(相当于使用
fromfile()
方法从文件中读取数据)。3.2 新版功能:
fromstring()
重命名为frombytes()
以使其含义更清晰。
array.
fromfile
(f, n)¶从 file objectf 中读取 n 项(解读为机器值)并将它们添加到数组末尾。 如果可读取数据少于 n 项则将引发
EOFError
,但有效的项仍然会被插入数组。 f 必须为一个真实的内置文件对象;不支持带有read()
方法的其它对象。
array.
fromlist
(list)¶添加来自 list 的项。 这等价于
forxinlist:a.append(x)
,区别在于如果发生类型错误,数组将不会被改变。
array.
fromstring
()¶已弃用的
frombytes()
的别名。Deprecated since version 3.2, will be removed in version 3.9.
array.
fromunicode
(s)¶使用来自给定 Unicode 字符串的数组扩展数组。 数组必须是类型为
'u'
的数组;否则将引发ValueError
。 请使用array.frombytes(unicodestring.encode(enc))
来将 Unicode 数据添加到其他类型的数组。
array.
index
(x)¶返回最小的 i 使得 i 为 x 在数组中首次出现的序号。
array.
insert
(i, x)¶将值 x 作为新项插入数组的 i 位置之前。 负值将被视为相对于数组末尾的位置。
array.
pop
([i])¶从数组中移除序号为 i 的项并将其返回。 可选参数值默认为
-1
,因此默认将移除并返回末尾项。
array.
remove
(x)¶从数组中移除首次出现的 x。
array.
reverse
()¶反转数组中各项的顺序。
array.
tobytes
()¶将数组转换为一个机器值数组并返回其字节表示(即相当与通过
tofile()
方法写入到文件的字节序列。)3.2 新版功能:
tostring()
被重命名为tobytes()
以使其含义更清晰。
array.
tofile
(f)¶将所有项(作为机器值)写入到 file objectf。
array.
tolist
()¶将数组转换为包含相同项的普通列表。
array.
tostring
()¶tobytes()
的已弃用别名。Deprecated since version 3.2, will be removed in version 3.9.
array.
tounicode
()¶将数组转换为一个 Unicode 字符串。 数组必须是类型为
'u'
的数组;否则将引发ValueError
。 请使用array.tobytes().decode(enc)
来从其他类型的数组生成 Unicode 字符串。
当一个数组对象被打印或转换为字符串时,它会表示为 array(typecode,initializer)
。 如果数组为空则 initializer 会被省略,否则如果 typecode 为 'u'
则它是一个字符串,否则它是一个数字列表。 使用 eval()
保证能将字符串转换回具有相同类型和值的数组,只要 array
类已通过 fromarrayimportarray
被引入。 例如:
array('l')array('u','hello \u2641')
array('l',[1,2,3,4,5])
array('d',[1.0,2.0,3.14])
参见
- 模块
struct
打包和解包异构二进制数据。
- 模块
xdrlib
打包和解包用于某些远程过程调用系统的 External Data Representation (XDR) 数据。
- The Numerical Python Documentation
Numeric Python 扩展 (NumPy) 定义了另一种数组类型;请访问 http://www.numpy.org/ 了解有关 Numerical Python 的更多信息。