通过实例解析Python RPC实现原理及方法

单线程同步

  • 使用socket传输数据
  • 使用json序列化消息体
  • struct将消息编码为二进制字节串,进行网络传输

消息协议

// 输入

{

in: "ping",

params: "ireader 0"

}

// 输出

{

out: "pong",

result: "ireader 0"

}

客户端 client.py

# coding: utf-8

# client.py

import json

import time

import struct

import socket

def rpc(sock, in_, params):

response = json.dumps({"in": in_, "params": params}) # 请求消息体

length_prefix = struct.pack("I", len(response)) # 请求长度前缀

sock.sendall(length_prefix)

sock.sendall(response)

length_prefix = sock.recv(4) # 响应长度前缀

length, = struct.unpack("I", length_prefix)

body = sock.recv(length) # 响应消息体

response = json.loads(body)

return response["out"], response["result"] # 返回响应类型和结果

if __name__ == '__main__':

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

s.connect(("localhost", 8080))

for i in range(10): # 连续发送10个rpc请求

out, result = rpc(s, "ping", "ireader %d" % i)

print out, result

time.sleep(1) # 休眠1s,便于观察

s.close() # 关闭连接

服务端 blocking_single.py

# coding: utf8

# blocking_single.py

import json

import struct

import socket

def handle_conn(conn, addr, handlers):

print addr, "comes"

while True: # 循环读写

length_prefix = conn.recv(4) # 请求长度前缀

if not length_prefix: # 连接关闭了

print addr, "bye"

conn.close()

break # 退出循环,处理下一个连接

length, = struct.unpack("I", length_prefix)

body = conn.recv(length) # 请求消息体

request = json.loads(body)

in_ = request['in']

params = request['params']

print in_, params

handler = handlers[in_] # 查找请求处理器

handler(conn, params) # 处理请求

def loop(sock, handlers):

while True:

conn, addr = sock.accept() # 接收连接

handle_conn(conn, addr, handlers) # 处理连接

def ping(conn, params):

send_result(conn, "pong", params)

def send_result(conn, out, result):

response = json.dumps({"out": out, "result": result}) # 响应消息体

length_prefix = struct.pack("I", len(response)) # 响应长度前缀

conn.sendall(length_prefix)

conn.sendall(response)

if __name__ == '__main__':

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 创建一个TCP套接字

sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) # 打开reuse addr选项

sock.bind(("localhost", 8080)) # 绑定端口

sock.listen(1) # 监听客户端连接

handlers = { # 注册请求处理器

"ping": ping

}

loop(sock, handlers) # 进入服务循环

多线程同步

  • 使用线程库thread创建原生线程
  • 服务器可并行处理多个客户端

服务端 multithread.py

多进程同步

  • Python的GIL导致单个进程只能占满一个CPU核心,多线程无法利用多核优势
  • os.fork()会生成子进程
  • 子进程退出后,父进程需使用waitpid系统调用收割子进程,防止其称为僵尸资源
  • 在子进程中关闭服务器套接字后,在父进程中也要关闭服务器套接字
  • 因为进程fork后,父子进程都有自己的套接字引用指向内核的同一份套接字对象,套接字引用计数为2,对套接字进程close,即将套接字对象的引用计数减1

PreForking同步

  • 进程比线程耗费资源,通过PreForking进程池模型对服务器开辟的进程数量进行限制,避免服务器负载过重
  • 如果并行的连接数量超过了prefork进程数量,后来的客户端请求将会阻塞

单进程异步

  • 通过事件轮询API,查询相关套接字是否有响应的读写事件,有则携带事件列表返回,没有则阻塞
  • 拿到读写事件后,可对事件相关的套接字进行读写操作
  • 设置读写缓冲区
  • Nginx/Nodejs/Redis都是基于异步模型
  • 异步模型编码成本高,易出错,通常在公司业务代码中采用同步模型,仅在讲究高并发高性能的场合才使用异步模型

PreForking异步

Tornado/Nginx采用了多进程PreForking异步模型,具有良好的高并发处理能力

以上是 通过实例解析Python RPC实现原理及方法 的全部内容, 来源链接: utcz.com/z/327954.html

回到顶部