python入门之进程与线程

python

  进程:一个整体的形式暴露给操作系统管理,里面包含对各种资源的调用,内存的管理,网络接口的调用等,对各种资源管理的基本单位。

  线程:操作系统最小的调度单位, 是一串指令的集合,进程中的一个执行单元。

  一个进程至少有一个线程。

  全局解释器锁(GIL):python虚拟机的访问由全局解释器锁控制,这个锁能保证同一时刻只有一个线程运行。

进程与线程的区别

  ◐ 线程之间共享内存空间,而进程的内存是独立,即使是父子进程

  ◐ 同一个进程的线程之间可以直接交流,两个进程想通信,必须通过一个中间代理来实现

  ◐ 创建新线程很简单,但是创建一个新进程需要克隆一次父进程

  ◐ 一个线程可以控制和操作同一个进程内的其他线程,而进程只能操作子进程

 

多线程环境中,python虚拟机的执行方式

  (1)设置GIL

  (2)切换到一个线程运行

  (3)运行指定数量的指令或者线程主动让开控制

  (4)把线程设置为睡眠状态

  (5)解锁GIL

  (6)从头再来执行其他的线程

 

Part1 简单的线程

 1 import threading

2 import time

3

4 def test(n):

5 print("thread",n)

6 time.sleep(3)

7

8 t1 = threading.Thread(target=test,args=("tt1",)) # 启动一个线程t1,执行test函数,参数为字符串tt1

9 t2 = threading.Thread(target=test,args=("tt2",))

10 t1.start() # 使用两个线程执行这个函数,cpu在t1执行完print后,遇到sleep,就会切换到t2执行print

11 t2.start()

12

13 # test("tt1") # 而直接调用两个函数执行,cpu会先执行完第一个,再执行下一个,这样比多线程多了个执行sleep的时间

14 # test("tt2")

Part2 用类的形式启动线程

 1 # 用类的形式启动线程

2 import threading

3

4 class MyThread(threading.Thread):

5 def __init__(self,n):

6 super(MyThread,self).__init__()

7 self.n = n

8

9 def run(self): # 这里必须是run函数,不能取其他名,里面写死了会调用run函数

10 print("run thread",self.n)

11

12 t1 = MyThread("tt1")

13 t2 = MyThread("tt2")

14 t1.start()

15 t2.start()

Part3 主线程等待子线程执行完成

 1 import threading

2 import time

3

4 def run(n):

5 print("th:",n,threading.current_thread()) # 可以查看当前进程是为主线程还是子线程

6 time.sleep(2)

7

8 start_time = time.time()

9 t_list = [] # 定义一个空列表,用来存启动的子线程

10 for i in range(50):

11 t = threading.Thread(target=run,args=("t-%d" %i,))

12 t.start()

13 t_list.append(t)

14 # print("cost time:",time.time()-start_time)

15 # 按目前所知可得,这里打印的时间是整个程序执行一共花的时间。但是最终执行下来时间只有0.02左右,里面怎么没有包含函数sleep的时间呢

16 # 一个进程至少有一个线程,从执行这个程序开始,就启动了一个主线程,而主线程中启动了50个子线程,而子线程启动后和主线程独立没有影响(主子并行)

17 # 其中的print语句也是主线程部分,sleep语句是子线程部分,所以打印的时间是主线程启动了50个子线程的时间,主线程并不会等待子线程执行完了再执行后面的程序

18 print(threading.active_count()) # 输出51,表示当前存活的线程,包含主线程

19 for t in t_list:

20 t.join()

21

22 print("cost time:",time.time()-start_time,threading.current_thread())

23 # 这里就使用join来等待子线程的完成,其中等待是指主线程等待子线程执行完后再继续执行,默认程序最后都有一个join

24 # 不能直接在启动线程的循环里写join,那样会变成串行,因为每启动一个线程,都要等待执行完成后才启动下一个线程

25 # 这里直接循环每个已经启动了的线程,主线程会等所有的子线程执行完后再执行print时间

Part4 守护线程

 1 # 守护线程,主线程执行完了,不管守护线程有没有执行完都退出

2 import threading

3 import time

4

5 def run(n):

6 print("th:",n)

7 time.sleep(2)

8

9 start_time = time.time()

10 for i in range(50):

11 t = threading.Thread(target=run,args=("t%d" %i,))

12 t.setDaemon(True) # 把当前线程设置为守护线程,必须在start之前设置

13 t.start()

14 print("cost time:",time.time()-start_time)

15 # 主线程不是守护线程,程序会等主线程执行完之后,不会等待守护线程,也就是子线程,就直接程序退出了

Part5 使用全局解释器锁

 1 # 设置全局解释器锁

2 import threading

3 import time

4

5 def run(n):

6 lock.acquire() # 设置锁

7 print("th:",n)

8 global num

9 num += 1

10 lock.release() # 释放锁

11 time.sleep(2)

12

13 lock = threading.Lock() # 生成一个锁

14 num = 0

15 start_time = time.time()

16 for i in range(50):

17 t = threading.Thread(target=run,args=("t%d" %i,))

18 t.start()

19 print(num)

20 print("cost time:",time.time()-start_time)

Part6 使用递归锁

 1 import threading, time

2

3 def run1():

4 print("grab the first part data")

5 lock.acquire()

6 global num

7 num += 1

8 lock.release()

9 return num

10

11 def run2():

12 print("grab the second part data")

13 lock.acquire()

14 global num2

15 num2 += 1

16 lock.release()

17 return num2

18

19 def run3():

20 lock.acquire()

21 res = run1()

22 print('--------between run1 and run2-----')

23 res2 = run2()

24 lock.release()

25 print(res, res2)

26

27 num, num2 = 0, 0

28 lock = threading.RLock() # 定义递归锁

29 for i in range(10):

30 t = threading.Thread(target=run3)

31 t.start()

32

33 while threading.active_count() != 1:

34 print(threading.active_count())

35 else:

36 print('----all threads done---')

37 print(num, num2)

Part7 信号量

 1 # 信号量 一般用于连接池,并发数

2 import threading, time

3

4 def run(n):

5 semaphore.acquire()

6 time.sleep(1)

7 print("run the thread: %s\n" % n)

8 semaphore.release()

9

10 if __name__ == '__main__':

11 semaphore = threading.BoundedSemaphore(5) # 最多允许5个线程同时运行,并非5个执行完了再执行下5个,是保持在5个

12 for i in range(22):

13 t = threading.Thread(target=run, args=(i,))

14 t.start()

15 while threading.active_count() != 1:

16 pass # print threading.active_count()

17 else:

18 print('----all threads done---')

Part8 队列queue

 1 import queue

2

3 q = queue.Queue() # 实例化队列,数据先入先出

4 # q = queue.Queue(maxsize=3) 最多存放3个数据,put第四个时候就会卡住,等数据有被取走,就放进去

5 # q = queue.LifoQueue() 数据后入先出

6 # q = queue.PriorityQueue() 设置优先级

7

8 q.put("a") # 存入数据

9 q.put(123)

10 #q.put("a",block=False) # 放进数据超过指定最大数量就会报异常

11 #q.put("a",timeout=3) # q满了,等待3秒还是不能放进去的话就报错

12 #q.put((2,"p1")) 传入元组,第一个元素是优先级,从小到大取数据

13 #q.put((-1,"p1"))

14 #q.put((6,"p1"))

15

16 print(q.qsize()) # 返回队列里元素数量

17 print(q.get()) # 获取一个数据,如果队列里没有数据就会卡住

18 #q.get(timeout=3) # 有数据就立刻获取返回,如果没有数据就等待3秒,若依然没有数据就报异常

19 #q.get(block=False) # 如果队列里没有数据就会报异常,默认为True

20 #q.get_nowait() # 如果队列里没有数据就会报异常

Part9 生产消费模型

 1 import threading

2 import time

3 import queue

4

5 q = queue.Queue(maxsize=10)

6

7 def productData(name):

8 i = 1

9 while True:

10 time.sleep(0.4)

11 q.put("数据%s" %i)

12 print("[%s] 生产了 数据[%s]" %(name,i))

13 i += 1

14

15 def consumeData(name):

16 while True:

17 print("[%s] 消费了 [%s]" %(name,q.get()))

18 time.sleep(1)

19

20 p = threading.Thread(target=productData,args=("p1",))

21 c1 = threading.Thread(target=consumeData,args=("c1",))

22 c2 = threading.Thread(target=consumeData,args=("c2",))

23 p.start()

24 c1.start()

25 c2.start()

以上是 python入门之进程与线程 的全部内容, 来源链接: utcz.com/z/388739.html

回到顶部