Python Study (06)内存管理GC

python

对象在内存的存储,我们可以求助于Python的内置函数id()。它用于返回对象的身份(identity)。其实,这里所谓的身份,就是该对象的内存地址。

a = 1

print(id(a)) #11246696内存地址的十进制

print(hex(id(a))) #'0xab9c68'十六进制

在Python中,整数和短小的字符,Python都会缓存这些对象,也就是有个对象缓存池,以便重复使用和减少频繁申请和回收内存的开销。

当我们创建多个等于1的引用时,实际上是让所有这些引用指向同一个对象。

a = 1

b = 1

print(id(a)) #11246696

print(id(b)) #11246696

可见a和b实际上是指向同一个对象的两个引用。

检验两个引用指向同一个对象,我们可以用is关键字。is用于判断两个引用所指的对象是否相同。

复制代码

# True

a = 1

b = 1

print(a is b)

# False

a = 257

b = 257

print(a is b) #因为int缓存的范围是[-5,256)

# True

a = "good"

b = "good"

print(a is b)

# False

a = "very good morning"

b = "very good morning"

print(a is b)

# False

a = []

b = []

print(a is b)

可以看到,由于Python缓存了整数和短字符串,因此每个对象只存有一份。

比如,所有整数1的引用都指向同一对象。即使使用赋值语句,也只是创造了新的引用,而不是对象本身。长的字符串和其它对象可以有多个相同的对象,可以使用赋值语句创建出新的对象。

引用计数

在Python中,每个对象都有存有指向该对象的引用总数,即引用计数(reference count)。

我们可以使用sys包中的getrefcount(),来查看某个对象的引用计数。需要注意的是,当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用。因此,getrefcount()所得到的结果,会比期望的多1。由于上述原因,两个getrefcount将返回2和3,而不是期望的1和2。

from sys import getrefcount

a = [1, 2, 3]

print(getrefcount(a))

b = a

print(getrefcount(b))

垃圾回收

垃圾回收时,Python不能进行其它的任务。频繁的垃圾回收将大大降低Python的工作效率。如果内存中的对象不多,就没有必要总启动垃圾回收。所以,Python只会在特定条件下,自动启动垃圾回收。当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于某个阈值时,垃圾回收才会启动。

我们可以通过gc模块的get_threshold()方法,查看该阈值:

import gc

print(gc.get_threshold())

返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,后面可以看到。700即是垃圾回收启动的阈值。可以通过gc中的set_threshold()方法重新设置。

我们也可以手动启动垃圾回收,即使用gc.collect()。

使用了

“引用计数”“复制清理”“分代复制”

和Java类似

以上是 Python Study (06)内存管理GC 的全部内容, 来源链接: utcz.com/z/387329.html

回到顶部