协程

与子程序(或者说函数)一样,协程(coroutine)也是一种程序组件。Donald Knuth 曾说,子程序是协程的特例

一个子程序就是一次函数调用,它只有一个入口,一次返回,调用顺序是明确的。但协程的调用和子程序则大不一样,协程允许有多个入口对程序进行中断、继续执行等操作

Python2 可以通过 yield 来实现基本的协程,但不够强大,第三方库 gevent 对协程提供了强大的支持。另外,Python3.5 提供了 async/await 语法来实现对协程的支持。本文只讨论通过 yield 来实现协程。

对于经典的生产者-消费者模型,如果用多线程来实现,我们就需要一个线程写消息,一个线程读消息,而且需要锁机制来避免对共享资源的访问冲突。

相比多线程,协程的一大特点就是它在一个线程内执行,既避免了多线程之间切换带来的开销,也避免了对共享资源的访问冲突。

下面,让我们看看怎么用 yield 来实现简单的生产者-消费者模型

import time

def consumer():
    message = ''
    while True:
        n = yield message     # yield 使函数中断
        if not n:
            return
        print '[CONSUMER] Consuming %s...' % n
        time.sleep(2)
        message = '200 OK'

def produce(c):
    c.next()           # 启动生成器
    n = 0
    while n < 5:
        n = n + 1
        print '[PRODUCER] Producing %s...' % n
        r = c.send(n)  # 通过 send 切换到 consumer 执行
        print '[PRODUCER] Consumer return: %s' % r
    c.close()

if __name__ == '__main__':
    c = consumer()
    produce(c)

在上面的代码中,消费者 consumer 是一个生成器函数,我们把它作为参数传给 produce,其中,next 方法用于启动生成器,send 方法用于发送消息给 consumer,并切换到 consumer 执行。consumer 通过 yield 获取到消息,然后进行处理,又通过 yield 返回消息给 produce,并转到 produce 执行,如此反复。执行结果如下:

[PRODUCER] Producing 1...
[CONSUMER] Consuming 1...
[PRODUCER] Consumer return: 200 OK
[PRODUCER] Producing 2...
[CONSUMER] Consuming 2...
[PRODUCER] Consumer return: 200 OK
[PRODUCER] Producing 3...
[CONSUMER] Consuming 3...
[PRODUCER] Consumer return: 200 OK
[PRODUCER] Producing 4...
[CONSUMER] Consuming 4...
[PRODUCER] Consumer return: 200 OK
[PRODUCER] Producing 5...
[CONSUMER] Consuming 5...
[PRODUCER] Consumer return: 200 OK

小结

  • 子程序就是协程的一种特例
  • 协程的特点在于是一个线程内执行,没有线程之间切换的开销
  • 协程只有一个线程,不需多线程的锁机制
  • 协程的切换由用户自己管理和调度
  • 通过创建协程将异步编程同步化

参考资料