3.4 特殊函数

到目前为止,你已经知道怎么写一个函数了。但是,从“知道”到“做到”还有很长的距离,要自己能够熟练写出函数,还需要读者找机会多练习。

在Python中,除了自己写函数之外,它还提供了一些特有的函数,比如前面已经多次出现的内建函数,还有某些模块中的函数等,但是,看了这里要说的特殊函数之后,你的确会感受到它们的不一样,它们常常被认为是“函数式编程”的代表。

3.4.1 递归

递归不是函数,而是一种思想。之所以放到这里是因为在函数中要用到,所以先行说明此思想,然后讲述几个特殊函数。

什么是递归?

递归,见递归。

这是对“递归”最精简的定义。还可以用另外一种形式定义:

从前有座山,山里有座庙,庙里有个老和尚,正在给小和尚讲故事。故事是什么呢?从前有座山,山里有座庙,庙里有个老和尚,正在给小和尚讲故事。故事是什么呢?从前有座山,山里有座庙,庙里有个老和尚,正在给小和尚讲故事。故事是什么呢?……

如果用上面的内容做递归的定义,总感觉有点调侃,来个严肃的(选自维基百科):

递归(英语:Recursion),又译为递回,在数学与计算机科学中,是指在函数的定义中使用函数自身的方法。

最典型的递归例子之一是斐波那契数列。

根据斐波那契数列的定义,可以直接写成这样的斐波那契数列递归函数。

  1. #!/usr/bin/env python
  2. # coding=utf-8
  3.  
  4. def fib(n):
  5. if n==0:
  6. return 0
  7. elif n==1:
  8. return 1
  9. else:
  10. return fib(n-1) + fib(n-2)
  11.  
  12. if __name__ == "__main__":
  13. f = fib(10)
  14. print f

把上述代码保存。这个代码的意图是要得到n=10的值。运行之:

  1. $ python 20401.py
  2. 55

fib(n-1)+fib(n-2)就是又调用了这个函数自己,实现递归。为了明确递归的过程,下面走一个计算过程(考虑到次数不能太多,就让n=3)。

1.n=3,fib(3),自然要走return fib(3-1)+fib(3-2)分支。

2.先看fib(3-1),即fib(2)也要走else分支,于是计算fib(2-1)+fib(2-2)。

3.fib(2-1)即fib(1),在函数中就要走elif分支,返回1,即fib(2-1)=1。同理,容易得到fib(2-2)=0。将这两个值返回到上面一步。得到fib(3-1)=1+0=1。

4.再计算fib(3-2),就简单了一些,返回的值是1,即fib(3-2)=1。

5.最后计算第一步中的结果:fib(3-1)+fib(3-2)=1+1=2,将计算结果2作为返回值。

从而得到fib(3)的结果是2。

从上面的过程中可以看出,每个递归的过程都是向着最初的已知条件a0=0和a1=1方向挺进一步,直到通过这个最底层的条件得到结果,然后再一层一层向上回馈计算结果。

其实,上面的代码有一个问题。因为a0=0、a1=1是已知的了,不需要每次都判断一边。所以,还可以优化一下,优化的基本方案就是初始化最初的两个值。

  1. #!/usr/bin/env python
  2. # coding=utf-8
  3.  
  4. meno = {0:0, 1:1} #初始化
  5.  
  6. def fib(n):
  7. if not n in meno:
  8. meno[n] = fib(n-1) + fib(n-2)
  9. return meno[n]
  10.  
  11. if __name__ == "__main__":
  12. f = fib(10)
  13. print f
  14. #运行结果
  15. $ python 20402.py
  16. 55

以上实现了递归,但是,至少在Python中,递归要慎重使用。因为在一般情况下,递归是能够被迭代或者循环替代的,而且后者的效率常常比递归要高。所以,我的个人建议是,对使用递归要考虑周密,不小心就会永远运行下去。

3.4.2 几个特殊函数

特殊函数的特殊在于跟“函数式编程”扯上了关系。

如果以前没有听过,等你开始进入编程界,也会经常听人说“函数式编程”、“面向对象编程”、“指令式编程”等术语。它们是什么呢?这个话题要从“编程范式”讲起。(以下内容源自维基百科)

编程范型或编程范式(英语:Programming paradigm范即模范之意,范式即模式、方法),是一类典型的编程风格,是指从事软件工程的一类典型的风格(可以对照方法学)。如:函数式编程、程序编程、面向对象编程、指令式编程等为不同的编程范型。

编程范型提供了(同时决定了)程序员对程序执行的看法。例如,在面向对象编程中,程序员认为程序是一系列相互作用的对象,而在函数式编程中一个程序会被看作是一个无状态的函数计算的串行。

正如软件工程中不同的群体会提倡不同的“方法学”一样,不同的编程语言也会提倡不同的“编程范型”。一些语言是专门为某个特定的范型设计的(如Smalltalk和Java支持面向对象编程,而Haskell和Scheme则支持函数式编程),同时还有另外一些语言支持多种范型(如Ruby、Common Lisp、Python和Oz)。

编程范型和编程语言之间的关系十分复杂,由于一个编程语言可以支持多种范型。例如,C++设计时,支持过程化编程、面向对象编程以及泛型编程。然而,设计师和程序员们要考虑如何使用这些范型元素来构建一个程序。一个人可以用C++写出一个完全过程化的程序,另一个人也可以用C++写出一个纯粹的面向对象程序,甚至还有人可以写出杂糅了两种范型的程序。

建议读者将上面这段话认真读完,不管是理解还是不理解,总能有点感觉的。

正如前面引文中所说的,Python是支持多种范型的语言,可以进行所谓的函数式编程,其突出体现在有这么几个函数:

filter、map、reduce、lambda、yield

有了它们,最大的好处是程序更简洁;没有它们,程序也可以用别的方式实现,只不过可能要多写几行罢了。所以,还是能用则用之吧。更何况,恰当地使用这几个函数,能让别人感觉你更牛。(注:本节不对yield进行介绍,后面介绍。)

1.lambda

lambda函数是一个只用一行就能解决问题的函数,听着是多么诱人呀。看下面的例子:

  1. >>> def add(x):
  2. ... x += 3
  3. ... return x
  4. ...
  5. >>> numbers = range(10)
  6. >>> numbers
  7. [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
  8.  
  9. >>> new_numbers = []
  10. >>> for i in numbers:
  11. ... new_numbers.append(add(i)) #调用add()函数,并append到list中
  12. ...
  13. >>> new_numbers
  14. [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

在这个例子中,add()只是一个中间操作。当然,上面的例子完全可以用别的方式实现。比如:

  1. >>> new_numbers = [ i+3 for i in numbers ]
  2. >>> new_numbers
  3. [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

首先说明,这种列表解析的方式是非常好的。

但是,我们偏偏要用lambda这个函数替代add(x),如果你和我一样这么偏执,就可以:

  1. >>> lam = lambda x: x + 3
  2. >>> n2 = []
  3. >>> for i in numbers:
  4. ... n2.append(lam(i))
  5. ...
  6. >>> n2
  7. [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

这里的lam就相当于add(x),请对应一下,这一行lambda x:x+3就完成add(x)的三行,特别是最后返回值。还可以写这样的例子:

  1. >>> g = lambda x,y:x+y
  2. >>> g(3,4)
  3. 7
  4. >>> (lambda x:x**2)(4)
  5. 16

通过上面的例子,总结一下lambda函数的使用方法:

  • 在lambda后面直接跟变量。
  • 变量后面是冒号。
  • 冒号后面是表达式,表达式计算结果就是本函数的返回值。为了简明扼要,用一个式子表示是必要的:
  1. lambda arg1, arg2, ...argN : expression using arguments

要特别提醒读者:虽然lambda函数可以接收任意多个参数(包括可选参数)并且返回单个表达式的值,但是lambda函数不能包含命令,包含的表达式不能超过一个。不要试图向lambda函数中塞入太多的东西;如果你需要更复杂的东西,应该定义一个普通函数,想让它多长就多长。

就lambda而言,它并没有给程序带来性能上的提升,但带来的是代码的简洁。比如,要打印一个list,里面依次是某个数字的1次方、二次方、三次方、四次方。用lambda可以这样做:

  1. >>> lamb = [ lambda x:x, lambda x:x**2, lambda x:x**3, lambda x:x**4 ]
  2. >>> for i in lamb:
  3. ... print i(3),
  4. ...
  5. 3 9 27 81

lambda作为一个单行的函数,在编程实践中可以选择使用。

2.map

先看一个例子,还是上面讲述lambda时的第一个例子,用map也能够实现:

  1. >>> numbers
  2. [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
  3. >>> map(add, numbers) #只引用函数名称add即可
  4. [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
  5.  
  6. >>> map(lambda x: x+3, numbers) #用lambda当然可以啦
  7. [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

map()是Python的一个内置函数,它的基本样式是:

  1. map(func, seq)

func是一个函数,seq是一个序列对象。在执行的时候,序列对象中的每个元素,按照从左到右的顺序依次被取出来,塞入到func函数里面,并将func的返回值依次存到一个列表中。

在应用中,map所能实现的也可以用别的方式实现。比如:

  1. >>> items = [1, 2, 3, 4, 5]
  2. >>> squared = []
  3. >>> for i in items:
  4. ... squared.append(i**2)
  5. ...
  6. >>> squared
  7. [1, 4, 9, 16, 25]
  8.  
  9. >>> def sqr(x): return x**2
  10. ...
  11. >>> map(sqr, items)
  12. [1, 4, 9, 16, 25]
  13.  
  14. >>> map(lambda x: x**2, items)
  15. [1, 4, 9, 16, 25]
  16.  
  17. >>> [ x**2 for x in items ] #这个我最喜欢了,速度快,可读性强
  18. [1, 4, 9, 16, 25]

条条大路通罗马,在编程中,以上方法自己根据需要来选用。

在以上感性认识的基础上,再来阅读map()的官方说明,能够更明白一些。

map(function,iterable,…)

Apply function to every item of iterable and return a list of the results.If additional iterable arguments are passed,function must take that many arguments and is applied to the items from all iterables in parallel.If one iterable is shorter than another it is assumed to be extended with None items.If function is None,the identity function is assumed;if there are multiple arguments,map()returns a list consisting of tuples containing the corresponding items from all iterables(a kind of transpose operation).The iterable arguments may be a sequence or any iterable object;the result is always a list.

理解要点:

  • 对iterable中的每个元素,依次应用function的方法(函数)(这本质上就是一个for循环)。
  • 将所有结果返回一个列表。
  • 如果参数很多,则对那些参数并行执行function。例如:
  1. >>> lst1 = [1,2,3,4,5]
  2. >>> lst2 = [6,7,8,9,0]
  3. >>> map(lambda x, y: x+y, lst1, lst2)
  4. [7, 9, 11, 13, 5]

请读者注意了,上面这个例子如果用for循环来写,还不是很难,如果扩展一下,下面的例子用for来改写,就要小心了:

  1. >>> lst1 = [1,2,3,4,5]
  2. >>> lst2 = [6,7,8,9,0]
  3. >>> lst3 = [7,8,9,2,1]
  4. >>> map(lambda x, y, z: x+y+z, lst1, lst2, lst3)
  5. [14, 17, 20, 15, 6]

这才显示出map的简洁优雅。

  1. reduce

直接看这个:

  1. >>> reduce(lambda x, y : x+y, [1, 2, 3, 4, 5])
  2. 15

请仔细观察,是否能够看出如何运算的呢?如图3-2所示。

3.4.1 递归 - 图1图3-2 运算图

对比一下map()的运算,能更理解reduce()。Map()是上下运算,reduce()是横着逐个元素进行运算。

权威的解释来自官网:

reduce(function,iterable[,initializer])

Apply function of two arguments cumulatively to the items of iterable,from left to right,so as to reduce the iterable to a single value.For example,reduce(lambda x,y:x+y,[1,2,3,4,5])calculates((((1+2)+3)+4)+5).The left argument,x,is the accumulated value and the right argument,y,is the update value from the iterable.If the optional initializer is present,it is placed before the items of the iterable in the calculation,and serves as a default when the iterable is empty.If initializer is not given and iterable contains only one item,the first item is returned.Roughly equivalent to:

  1. def reduce(function, iterable, initializer=None):
  2. it = iter(iterable)
  3. if initializer is None:
  4. try:
  5. initializer = next(it)
  6. except StopIteration:
  7. raise TypeError('reduce() of empty sequence with no initial value')
  8. accum_value = initializer
  9. for x in it:
  10. accum_value = function(accum_value, x)
  11. return accum_value

如果用我们熟悉的for循环来做上面reduce的事情,可以这样来做:

  1. >>> lst = range(1, 6)
  2. >>> lst
  3. [1, 2, 3, 4, 5]
  4. >>> r = 0
  5. >>> for i in range(len(lst)):
  6. ... r += lst[i]
  7. ...
  8. >>> r
  9. 15

for是普适的,reduce是简洁的。

为了锻炼思维,看这么一个问题,有两个list,a=[3,9,8,5,2],b=[1,4,9,2,6],计算:a[0]b[0]+a[1]b[1]+…的结果。

  1. >>> a
  2. [3, 9, 8, 5, 2]
  3. >>> b
  4. [1, 4, 9, 2, 6]
  5.  
  6. >>> zip(a ,b)
  7. [(3, 1), (9, 4), (8, 9), (5, 2), (2, 6)]
  8.  
  9. >>> sum(x*y for x, y in zip(a, b)) #解析后直接求和
  10. 133
  11.  
  12. >>> new_list = [x*y for x, y in zip(a, b)] #可以看作是上面方法的分步实施
  13.  
  14. >>> #这样解析也可以:new_tuple = (x*y for x, y in zip(a, b))
  15. >>> new_list
  16. [3, 36, 72, 10, 12]
  17. >>> sum(new_list) #或者:sum(new_tuple)
  18. 133
  19.  
  20. >>> reduce(lambda sum, (x, y): sum + x*y, zip(a,b), 0) #这个方法是在耍酷呢吗?
  21. 133
  22.  
  23. >>> from operator import add, mul #耍酷的方法也不止一个
  24. >>> reduce(add,map(mul,a,b))
  25. 133
  26.  
  27. >>> reduce(lambda x,y: x+y, map(lambda x,y: x*y, a,b)) #map,reduce,lambda都齐全了
  28. 133

如果读者使用的是Python 3,会跟上面有点儿不一样,因为在Python 3中,reduce()已经从全局命名空间中移除,放到了functools模块中,如果要是用,需要用from functools import reduce引入之。

3.filter

filter的中文含义是“过滤器”,在Python中,它起到了过滤器的作用。官方文档中这么说:

filter(function,iterable)

Construct a list from those elements of iterable for which function returns true.iterable may be either a sequence,a container which supports iteration,or an iterator.If iterable is a string or a tuple,the result also has that type;otherwise it is always a list.If function is None,the identity function is assumed,that is,all elements of iterable that are false are removed.

Note that filter(function,iterable)is equivalent to[item for item in iterable if function(item)]if function is not None and[item for item in iterable if item]if function is None.

这次真的不翻译了,而且也不解释要点了。请读者务必自己阅读上面的文字,并且理解其含义。

通过下面的程序代码体会:

  1. >>> numbers = range(-5, 5)
  2. >>> numbers
  3. [-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]
  4.  
  5. >>> filter(lambda x: x>0, numbers)
  6. [1, 2, 3, 4]
  7.  
  8. >>> [x for x in numbers if x>0] #与上面那句等效
  9. [1, 2, 3, 4]
  10.  
  11. >>> filter(lambda c: c!='i', 'qiwsir')
  12. 'qwsr'

至此,介绍了几个函数,这些函数在对程序的性能提高上并没有显著或者稳定预期,但是,在代码的简洁上是有目共睹的。有时候可以用来秀一秀,以彰显Python的优雅,或者自己耍酷。如何用及怎么用,就看你自己的喜好了。