10

在了解了迭代器类方法和生成器之后,我利用每个习语测试了简单的 Fizz Buzz 解决方案的性能特征:

>>> from timeit import timeit
>>> timeit('tuple(fizzbuzz.FizzBuzzIterator(10))', 'import fizzbuzz')
13.281935930252075
>>> timeit('tuple(fizzbuzz.fizz_buzz_generator(10))', 'import fizzbuzz')
7.619534015655518

根据timeit生成器函数大约比迭代器类快 1¾ 倍。

我的问题又来了:为什么这个 Fizz Buzz 生成器比这个 Fizz Buzz Iterator 类快得多?

Fizz Buzz 迭代器类

class FizzBuzzIterator:

    def __init__(self, low, high=None):
        if high is None:
            self.high = low
            self.current = 1
        else:
            self.high = high
            self.current = max(low, 1)

    def __iter__(self):
        return self

    def next(self):
        if self.current > self.high:
            raise StopIteration
        else:
            c = self.current
            self.current += 1
            if (c % 5 + c % 3) == 0:
                return 'FizzBuzz'
            elif c % 5 == 0:
                return 'Buzz'
            elif c % 3 == 0:
                return 'Fizz'
            else:
                return str(c)

Fizz Buzz 生成器功能

def fizz_buzz_generator(low, high=None):
    if high is None:
        high = low
        cur = 1
    else:
        cur = max(low, 1)
    while cur <= high:
        c = cur
        cur += 1
        if (c % 5 + c % 3) == 0:
            yield 'FizzBuzz'
        elif c % 5 == 0:
            yield 'Buzz'
        elif c % 3 == 0:
            yield 'Fizz'
        else:
            yield str(c)
4

1 回答 1

6

因为显然,生成器的实现比迭代器更有效。

您的第一个解决方案具有以下有趣的特征:

  1. 它使用对象。
  2. 对于n 个数字的迭代,调用3 + n 个方法并访问2 + 4·n 个属性,这都是潜在的缓慢操作。
  3. 异常用于控制流。

第二个解决方案不做这些,而是​​它yield意味着语言运行时执行繁重的工作。由于运行时通常在 C 中实现,因此这可以比您的第一个解决方案的高级代码优化得多。

接下来,您应该考虑实际进行的基准测试。为了获得良好的基准,您应该选择不同的输入大小n并观察两种解决方案在不同尺度下的比较。

  • 对于非常小的n,我们预计初始化成本占主导地位。这与您的结果一致,因为执行函数调用比创建对象更便宜。
  • 对于较大的n,我们期望算法的特征占主导地位。由于算法完全相同,因此图形应该具有相同的形状。但是每次迭代,第一个解决方案的成本要高得多(四个属性访问,一个方法调用)。然后,这两个解决方案将是具有略微不同斜率的图形。每次迭代成本的确切关系只能通过获得一个包含许多输入大小n的许多时间的大型数据集,然后为该数据拟合一个函数来评估。
于 2014-02-08T18:24:26.227 回答