协程
在python GIL下,一次只能运行一个线程,所以对于CPU密集型程序来说,线程间的切换开销就成了拖累,以I/O为瓶颈的程序是协程擅长的:
Python 中的协程已经取得了长足的进步。大致经历了以下三个阶段:
1.最初的生成器变形yield/send;
2.引入@asyncio.coroutine和yield from;
3.在最近的Python3.5版本中引入async/await关键字。
(1)从yield说起
先看一段普通的计算斐波那契续列的代码
def fibs(n):
res = [0] * n
index = 0
a = 0
b = 1
while index < n:
res[index] = b
a, b = b, a + b
index += 1
return res
for fib_res in fibs(20):
print(fib_res)
如果我们只是需要得到斐波那契数列的第n位,或者只是想据此生成斐波那契数列,那么上述传统方法会消耗更多的内存。
这时,yield就派上用场了。
def fib(n):
index = 0
a = 0
b = 1
while index < n:
yield b
a, b = b, a + b
index += 1
for fib_res in fib(20):
print(fib_res)
当函数包含 yield 语句时,Python 会自动将其识别为生成器。此时fib(20)实际上并没有调用函数体,而是生成了一个带有函数体的生成器对象实例。
这里yield可以保留fib函数的计算位置,暂停fib的计算,返回b。当将 fib 放入 for...in 循环时,每次循环都会调用 next(fib(20)) ,唤醒生成器,执行下一条 yield 语句,直到抛出 StopIteration 异常。这个异常会被for循环捕获,导致跳出循环。
(2) Send来了
从上面的程序可以看出,目前只有数据从fib(20)通过yield流向外面的for循环;如果可以将数据发送到 fib(20),是否可以在 Python 中实现协程?
所以Python中的generator有send函数,yield表达式也有返回值。
我们使用这个特性来模拟一个慢斐波那契数列的计算:
import time
import random
def stupid_fib(n):
index = 0
a = 0
b = 1
while index < n:
sleep_cnt = yield b
print('let me think {0} secs'.format(sleep_cnt))
time.sleep(sleep_cnt)
a, b = b, a + b
index += 1
print('-' * 10 + 'test yield send' + '-' * 10)
N = 20
sfib = stupid_fib(N)
fib_res = next(sfib)
while True:
print(fib_res)
try:
fib_res = sfib.send(random.uniform(0, 0.5))
except StopIteration:
break
python 进行并发编程
在Python 2时代,高性能网络编程主要使用三个库:Twisted、Tornado和Gevent,但它们的异步代码相互之间既不兼容也不移植。
asyncio是Python 3.4引入的标准库,直接支持异步IO。
asyncio 的编程模型是一个消息循环。我们直接从asyncio模块中获取EventLoop的引用,然后将需要执行的协程丢到EventLoop中执行,从而实现了异步IO。
Python 在 3.4 中引入了协程的概念,但这仍然是基于生成器对象。
Python 3.5添加了async和await这两个关键字,分别用来替换asyncio.coroutine和yield from。
Python3.5 决定了协程的语法。下面将简单介绍一下asyncio的使用。实现协程的不仅仅是asyncio,tornado和gevent都实现了类似的功能。
(1)协程定义
用asyncio实现Hello world代码如下:
import asyncio
@asyncio.coroutine
def hello():
print("Hello world!")
# 异步调用asyncio.sleep(1):
r = yield from asyncio.sleep(1)
print("Hello again!")
# 获取EventLoop:
loop = asyncio.get_event_loop()
# 执行coroutine
loop.run_until_complete(hello())
loop.close()
@asyncio.coroutine 将一个生成器标记为协程类型,然后我们将这个协程丢到EventLoop中去执行。 hello() 会先打印出 Hello world!,然后,yield from 语法可以让我们方便的调用另一个生成器。由于asyncio.sleep()也是协程,线程不会等待asyncio.sleep(),而是直接中断执行下一个消息循环。当asyncio.sleep()返回时,线程可以从yield from中获取返回值(此处为None),然后执行下一行语句。
将 asyncio.sleep(1) 视为需要 1 秒的 IO 操作。在此期间主线程不等待,而是在EventLoop中执行其他可执行的协程,因此可以实现并发执行。
我们用Task封装两个coroutine试试:
import threading
import asyncio
@asyncio.coroutine
def hello():
print('Hello world! (%s)' % threading.currentThread())
yield from asyncio.sleep(1)
print('Hello again! (%s)' % threading.currentThread())
loop = asyncio.get_event_loop()
tasks = [hello(), hello()]
loop.run_until_complete(asyncio.wait(tasks))
loop.close()
观察执行过程:
Hello world! (<_MainThread(MainThread, started 140735195337472)>)
Hello world! (<_MainThread(MainThread, started 140735195337472)>)
(暂停约1秒)
Hello again! (<_MainThread(MainThread, started 140735195337472)>)
Hello again! (<_MainThread(MainThread, started 140735195337472)>)
从打印的当前线程名可以看出,这两个协程是同一个线程并发执行的。
如果将asyncio.sleep()换成真正的IO操作,一个线程就可以并发执行多个协程。
asyncio案例实战
我们用asyncio的异步网络连接来获取sina、sohu和163的网站首页:
async_wget.py
import asyncio
@asyncio.coroutine
def wget(host):
print('wget %s...' % host)
connect = asyncio.open_connection(host, 80)
reader, writer = yield from connect
header = 'GET / HTTP/1.0\r\nHost: %s\r\n\r\n' % host
writer.write(header.encode('utf-8'))
yield from writer.drain()
while True:
line = yield from reader.readline()
if line == b'\r\n':
break
print('%s header > %s' % (host, line.decode('utf-8').rstrip()))
# Ignore the body, close the socket
writer.close()
loop = asyncio.get_event_loop()
tasks = [wget(host) for host in ['www.sina.com.cn', 'www.sohu.com', 'www.163.com']]
loop.run_until_complete(asyncio.wait(tasks))
loop.close()
结果信息如下:
wget www.sohu.com...
wget www.sina.com.cn...
wget www.163.com...
(等待一段时间)
(打印出sohu的header)
www.sohu.com header > HTTP/1.1 200 OK
www.sohu.com header > Content-Type: text/html
...
(打印出sina的header)
www.sina.com.cn header > HTTP/1.1 200 OK
www.sina.com.cn header > Date: Wed, 20 May 2015 04:56:33 GMT
...
(打印出163的header)
www.163.com header > HTTP/1.0 302 Moved Temporarily
www.163.com header > Server: Cdn Cache Server V2.0
...
可见3个连接由一个线程通过coroutine并发完成。
小结
asyncio提供了完善的异步IO支持;
异步操作需要在coroutine中通过yield from完成;
多个coroutine可以封装成一组Task然后并发执行。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python中如何判断是文件夹还是文件09/20
- ♥ Python中的数字类型有哪些?09/09
- ♥ 如何在Python中计算两行数据的内积09/20
- ♥ final作用域中的代码会被执行吗?12/28
- ♥ python中无法使用原始输入的原因11/20
- ♥ 如何搭建python http服务11/29
内容反馈