day17 生成器

it2022-05-05  188

1. 生成器定义

在Python中,一边循环一边计算的机制,称为生成器:generator。

2. 为什么要有生成器

列表所有数据都在内存中,如果有海量数据的话将会非常耗内存。

如:仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

如果列表元素按照某种算法推算出来,那我们就可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。

简单一句话:我又想要得到庞大的数据,又想让它占用空间少,那就用生成器!

 

3.如何创建生成器

第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

>>> L = [x * x for x in range(10)] #列表生成式 >>> g = (x * x for x in range(10)) #生成器 >>> g <generator object <genexpr> at 0x1022ef630>

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。

 

方法二, 如果一个函数中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个生成器函数!调用函数就是创建了一个生成器(generator)对象!

 

4. 生成器的工作原理

(1)生成器(generator)能够迭代的关键是它有一个next()方法,

  工作原理就是通过重复调用next()方法,直到捕获一个异常(异常就是把所有可迭代的对象都迭代完了就会异常,但for循环会帮我们自动处理这个错误,我们不用管!!)。

(2)带有 yield 的函数不再是一个普通函数,而是一个生成器函数!

  可用next()调用生成器对象来取值。next 两种方式 t.__next__()  和   next(t),第二种是在python2.7版本以后才发行的,推荐使用第二种!!

  可用for 循环获取返回值(每执行一次,取生成器里面一个值)

  (基本上不会用next()来获取下一个返回值,而是直接使用for循环来迭代,用next只能一次取一个值,太low了并且效率太低!!而且next的次数还得刚好跟函数的次数相等,超了就会报错,但for循环内部就帮我们处理了这个错误,迭代完了之后就自动停止了!)。

(3)yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。

(4).send() 和next()一样,都能让生成器继续往下走一步(下次遇到yield停),但send()能传一个值,这个值作为yield表达式整体的结果

  ——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10

 

感受下yield返回值的过程(关注点:每次停在哪,下次又开始在哪)及send()传参的通讯过程,

思考None是如何产生的(第一次取值:yield 返回了 i 值 0,停在yield i,temp没赋到值。第二次取值,开始在print,temp没被赋值,故打印None,i加1,继续while判断,yield  返回了 i 值 1,停在yield i):

4. 生成器的工作原理

(1)生成器(generator)能够迭代的关键是它有一个next()方法,

  工作原理就是通过重复调用next()方法,直到捕获一个异常。

(2)带有 yield 的函数不再是一个普通函数,而是一个生成器generator。

  可用next()调用生成器对象来取值。next 两种方式 t.__next__()  |  next(t)。

  可用for 循环获取返回值(每执行一次,取生成器里面一个值)

  (基本上不会用next()来获取下一个返回值,而是直接使用for循环来迭代)。

(3)yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。

(4).send() 和next()一样,都能让生成器继续往下走一步(下次遇到yield停),但send()能传一个值,这个值作为yield表达式整体的结果

  ——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10

 

总结:

1.什么是生成器?

生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是我什么时候调它,它什么时候开始计算一个新的值,并给你返回。

2.什么是生成器函数?

函数里存在yield的事生成器函数,这样的函数调用时不会执行函数里面的代码,而是会声称一个生成器对象,

这样的函数执行的时候要用next(),

这里要注意,不是函数的名字是生成器对象,而是整个函数(加上括号)才是生成器对象!

3.什么是可迭代对象?

有iter方法的才是可迭代对象,元祖,列表,字典都是!

4. 生成器名字.send(值)跟next(生成器的名字)最大的区别就是,send()后面的括号里面可以传值!(为yield前面的对象传值)

5.生成器都是迭代器,迭代器不一定是生成器。

6.什么是迭代器?

满足两个条件:1.有iter方法  2.有next方法

(这两个条件就是迭代器协议)

7.for循环内部三件事:

1.调用可迭代对象iter方法返回一个迭代器对象。

2.不断调用迭代器对象的next方法

3.处理stopiteration异常

第三点就是为什么我们用next()取生成器的值的时候,如果取光了会报错,但是用for循环遍历生成器的时候取尽了也不会报错而是自动停止,因为for循环帮我们处理了这个错误!!


最新回复(0)