首页 > 理解Python的迭代器(转)

理解Python的迭代器(转)

原文地址: http://python.jobbole.com/81916/

另外一篇文章: http://www.cnblogs.com/kaituorensheng/p/3826911.html

什么是迭代

可以直接作用于for循环的对象统称为可迭代对象(Iterable)。

可以被next()函数调用并不断返回下一个值的对象称为迭代器(Iterator)。

所有的Iterable均可以通过内置函数iter()来转变为Iterator。

对迭代器来讲,有一个__next()__就够了。在你使用for 和 in 语句时,程序就会自动调用即将被处理的对象的迭代器对象,然后使用它的__next__()方法,直到监测到一个StopIteration异常。

>>> L = [1,2,3]
>>> [x**2 for x in L]
[1, 4, 9]
>>> next(L)
Traceback (most recent call last):File "", line 1, in 
TypeError: 'list' object is not an iterator
>>> I=iter(L)
>>> next(I)
1
>>> next(I)
2
>>> next(I)
3
>>> next(I)
Traceback (most recent call last):File "", line 1, in 
StopIteration

上面例子中,列表L可以被for进行循环但是不能被内置函数next()用来查找下一个值,所以L是Iterable。

L通过iter进行包装后设为I,I可以被next()用来查找下一个值,所以I是Iterator。

题外话:

内置函数iter()仅仅是调用了对象的__iter()__方法,所以list对象内部一定存在方法__iter__()

内置函数next()仅仅是调用了对象的__next()__方法,所以list对象内部一定不存在方法__next__(),但是Itrator中一定存在这个方法。

for循环内部事实上就是先调用iter()把Iterable变成Iterator在进行循环迭代的。

>>> L = [4,5,6]
>>> I = L.__iter__()
>>> L.__next__()
Traceback (most recent call last):File "", line 1, in 
AttributeError: 'list' object has no attribute '__next__'
>>> I.__next__()
4
>>> from collections import Iterator, Iterable
>>> isinstance(L, Iterable)
True
>>> isinstance(L, Iterator)
False
>>> isinstance(I, Iterable)
True
>>> isinstance(I, Iterator)
True
>>> [x**2 for x in I]    
[25, 36]

Iterator继承自Iterable,从下面的测试中可以很方便的看到Iterator包含__iter()__和next()方法,而Iteratble仅仅包含__iter__()。

>>> from collections import Iterator, Iterable
>>> help(Iterator)
Help on class Iterator:class Iterator(Iterable)Method resolution order:IteratorIterablebuiltins.object   **注解:从这里可以看出Iterable继承自object, Iterator继承自Iterable。Methods defined here:__iter__(self)__next__(self)Return the next item from the iterator. When exhausted, raise StopIteration
......
>>> help(Iterable)
Help on class Iterable:class Iterable(builtins.object)Methods defined here:__iter__(self)

iterable需要包含有__iter()__方法用来返回iterator,而iterator需要包含有__next__()方法用来被循环

如果我们自己定义迭代器,只要在类里面定义一个 iter() 函数,用它来返回一个带 next() 方法的对象就够了。

直接上代码

class Iterable:def __iter__(self):return Iterator()class Iterator:def __init__(self):self.start=-1def __next__(self):self.start +=2if self.start >10:raise StopIterationreturn self.startI = Iterable()
for i in I:print(i)

上面的代码实现的是找到10以内的奇数,代码中的类名可以随便取,不是一定需要使用我上面提供的类名的。

如果在Iterator的__next__方法中没有实现StopIteration异常,那么则是表示的全部奇数,那么需要在调用的时候设置退出循环的条件。

class Iterable:def __iter__(self):return Iterator()class Iterator:def __init__(self):self.start=-1def __next__(self):self.start +=2return self.startI = Iterable()
for count, i in zip(range(5),I):    #也可以用内置函数enumerate来实现计数工作。print(i)

我们通过range来实现打印多少个元素,这里表示打印5个元素,返回结果和上面一致。

当然,我们可以把这两个类合并在一起,这样实现程序的简练。

最终版本如下

class Iterable:def __iter__(self):return selfdef __init__(self):self.start=-1def __next__(self):self.start +=2if self.start >10:raise StopIterationreturn self.startI = Iterable()
for i in I:print(i)

复制迭代器

迭代器是一次性消耗品,使用完了以后就空了,请看。

>>> L=[1,2,3]
>>> I=iter(L)
>>> for i in I:
...     print(i, end='-')
...
1-2-3-
>>>next(I)
Traceback (most recent call last):File "", line 1, in 
StopIteration

当循环以后就殆尽了,再次使用调用时会引发StopIteration异常。

我们想通过直接赋值的形式把迭代器保存起来,可以下次使用。

但是通过下面的范例可以看出来,根本不管用。

>>> I=iter(L)
>>> J=I
>>> next(I)
1
>>> next(J)
2
>>> next(I)
3
>>> next(J)
Traceback (most recent call last):File "", line 1, in 
StopIteration

那怎么样才能达到我们要的效果呢?

我们需要使用copy包中的deepcopy了,请看下面:

>>> import copy
>>> I=iter(L)
>>> J=copy.deepcopy(I)
>>> next(I)
1
>>> next(I)
2
>>> next(J)
1

迭代器不能向后移动, 不能回到开始。

所以需要做一些特殊的事情才能实现向后移动等功能。

以上代码均在Python 3.4 中测试通过。

转载于:https://www.cnblogs.com/nyist-xsk/p/7404897.html

更多相关:

  • 题目:合并两个排序的链表 输入两个递增排序的链表,合并这两个链表并使新链表中的节点仍然是递增排序的。 示例1: 输入:1->2->4, 1->3->4 输出:1->1->2->3->4->4 限制: 0 <= 链表长度 <= 1000 解题: /*** Definition for singly-linked li...

  • 题目:反转链表 定义一个函数,输入一个链表的头节点,反转该链表并输出反转后链表的头节点。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->NULL 限制: 0 <= 节点个数 <= 5000 解题: 方法一:双指针 我们可以申请两个指针,第一个指针叫 new_next,最...

  • LRU算法(Least Recently Used) 算是我们经常遇到的一种淘汰算法,其中内存管理模块进行内存页回收时有用到,针对不经常使用的内存页,LRU淘汰策略能够将该内存页回收给操作系统。 属于 我们操作系统设计中的 时间局部性原理,最长时间未被访问的数据优先淘汰,当内存中已存在的数据再次被访问时,则进行热度的提升。 本文为...

  • 题目描述 给定一个链表,两两交换其中相邻的节点,并返回交换后的链表。 你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换。 示例: 给定 1->2->3->4, 你应该返回 2->1->4->3. 方法一(递归): 将配对交换过程拆解为多个以两个元素为一对的子问题 …n(k-1) -> n(k)->n(k+1)...

  • 已知两个已排序链表头节点指针headA与headB,将这两个链表合并,合并后仍为 有序的,返回合并后的头节点。 主要步骤如下: 创建一个临时的头节点,头节点每次指向headA 或者 headB较小的节点当headA->data 比headB->data小的时候,headA的当前节点加入临时头节点,同时headA指针向后移动;否则h...

  • 2019独角兽企业重金招聘Python工程师标准>>> 一 造成segment fault,产生core dump的可能原因 容器使用越界问题 for(iter=q.begin();iter!=q.end();iter++)   q.erase(iter); deque q; for(i=0;i...