Python Select模型

Posted on 五月 11, 2017

IO多路复用

IO多路复用就是我们经常说的select epoll.select和epoll的好处是单个process就可以同时处理多个网络IO。基本原理是select\epoll会不断的轮询所负责的所有socket，当有某个socket数据到达了，就通知用户进程。
下面是流程图：

当用户进程调用了select，那么整个进程会被block，而同时，kernel会“监视”所有select负责的socket，当任何一个socket中的数据准备好了，select就会返回。这个时候用户进程再调用read操作，将数据从kernel拷贝到用户进程。

注意1：select函数返回结果中如果有文件可读了，那么进程就可以通过调用accept()或recv()来让kernel将位于内核中准备到的数据copy到用户区。

注意2: select的优势在于可以处理多个连接，不适用于单个连接

selectors

基于select模块实现的IO多路复用

IO多路复用实现机制

在不同的平台上是不一样的，win平台只有select,Linux平台有select poll epoll

win： select
linux : select poll epoll

通常是用户空间创建fd,然后copy到内核空间

如果是开fd的数量多，select的的效率低

基于select模块实现的IO多路复用

import selectors
import socket
sock = socket.socket()
sock.bind(("127.0.0.1", 8810))
sock.listen(5)  # 这里虽然设置了最大连接数，但是已经没有限制了
sel = selectors.DefaultSelector()  # 实例化一个对象，会根据不同的平台自动设置优先级
# epoll|kqueue|devpoll > poll > select.  所以Linux系统会自动设置成epoll  win 自动设置成select
# 第二步
def read(conn, mask):
    # pass
    try:  # win 检测异常  当有异常 如客户端断开的时候 
        data = conn.recv(1024)
        print(data)
        print(data.decode("utf-8"))
        data2 = input(">>>")
        conn.send(data2.encode("utf-8"))
    except Exception:
        sel.unregister(conn)  # 解除注册
# 第一步
def accept(sock, mask):  # mask 是没有用的
    conn, addr = sock.accept()
    # print(conn)
    sel.register(conn, selectors.EVENT_READ, read)  # 把conn 添加到列表中
# 首先要注册 只是把sock和 accept绑定
sel.register(sock, selectors.EVENT_READ, accept)  # 注册，但是没有监听accept函数
# 监听
while 1:
    print("waiting...")
    # event 就是那个r
    events = sel.select()  # [(key,mask) ,(key,mask) ,(key,mask) ,)]  # 活活动的对象会自动添加到这里
    for key, mask in events:  # events 是个列表 需要遍历
        print(key.data)  # 拿到accept函数
        print(key.fileobj)  # 当前的活动的对象 sock 文件句柄
        func = key.data  # 调用
        obj = key.fileobj  #
        func(obj, mask)  # 第一个参数是sock 对象
        # break

select缺点：

每次调用slect都要将所有的fd拷贝到内核空间（每次都要拷贝），导致效率下降
监听的的实现是通过遍历所有的fd,（遍历消耗的时间消耗多）判断是否有数据访问
最大连接数（input中放的文件描述符数量1024）

poll：

最大连接数没有限制了，除此之外，和select一样，所以基本不用

epoll:

内部通过3个函数实现（select是一个）

第一个函数：
创建epoll句柄，把所有的fd拷贝到内核空间，只需要拷贝一次

第二个函数：回掉函数
某一个函数或者动作成功完成后，会自动触发一个函数
为所有的fd绑定一个回调函数,一旦有数据访问，触发改回调函数,回调函数把fd放到链表中。（只要有活动，把fd放到链表中，动态监听）这样就提高了效率
例子：交试卷
第三个函数，判断链表是否为空

selectors.DefaultSelector()
selectors会根据自己的平台选择最佳IO多路复用，自动选择。win只有select
linux的中epoll中的优先级最高

队列queue

和线程有关系的，在多线程的时候有用，保证信息安全的

队列是一种数据类型

优点：
保证线程安全，不用自己加锁

put get

先进先出

import queue
q = queue.Queue(3) # 默认是先进先出  FIFO  设置参数是最大的存放数量5
q.put(111)
q.put("hello")
q.put(222)
q.put(333,False)  # 默认blocking = True ,False 是当存满的时候，自动报错，解除阻塞的状态
print(q.get())
print(q.get())
print(q.get())
print(q.get()) # 第4次已经拿不到了 取不到 默认阻塞
q.get(False) # 解除阻塞状态

先进后出

q = queue.LifoQueue()
q.put(111)
q.put(222)
print(q.get())
print(q.get())

优先级

q = queue.PriorityQueue()
q.put([4,"hello4"])
q.put([1,"hello1"])
q.put([2,"hello2"])
print(q.get())
print(q.get())
print(q.get())

join 与task_done方法

import queue
q = queue.Queue(5)
q.put(111)
q.put(222)
q.get()
q.task_done()  #
q.get()
q.task_done()  #
q.join()  # 等待task_done  和events是一个原理
print('endnig')

join 与task_done方法必须配合使用

其他的用法

q.qsize() 返回队列的大小
q.empty() 如果队列为空，返回True,反之False
q.full() 如果队列满了，返回True,反之False
q.full 与 maxsize 大小对应
q.get([block[, timeout]]) 获取队列，timeout等待时间
q.get_nowait() 相当q.get(False)非阻塞 
q.put(item) 写入队列，timeout等待时间
q.put_nowait(item) 相当q.put(item, False)
q.task_done() 在完成一项工作之后，q.task_done() 函数向任务已经完成的队列发送一个信号
q.join() 实际上意味着等到队列为空，再执行别的操作

生产者消费者模型

有生产数据的线程
有消费数据的线程

通过一个容器来解决生产者消费者强耦合的问题
这个容器是用来解耦的（类似吃饭的时候的服务员）
目录结构也是一种解耦

下面是用队列模拟实现

import time,random
import queue,threading
q = queue.Queue()
def Producer(name):
  count = 0
  while count <10:
    print("making........")
    time.sleep(random.randrange(3))
    q.put(count)
    print('Producer %s has produced %s baozi..' %(name, count))
    count +=1
    #q.task_done()
    #q.join()
    print("ok......")
def Consumer(name):
  count = 0
  while count <10:
    time.sleep(random.randrange(4))
    if not q.empty():
        data = q.get()
        #q.task_done()
        #q.join()
        print(data)
        print('\033[32;1mConsumer %s has eat %s baozi...\033[0m' %(name, data))
    else:
        print("-----no baozi anymore----")
    count +=1
p1 = threading.Thread(target=Producer, args=('A',))
c1 = threading.Thread(target=Consumer, args=('B',))
# c2 = threading.Thread(target=Consumer, args=('C',))
# c3 = threading.Thread(target=Consumer, args=('D',))
p1.start()
c1.start()
# c2.start()
# c3.start()