6个值得玩味的Python代码

先选取了 6 个自己认为值得玩味的 python 代码,希望对正在学习 python 的你有所帮助。

1、类有两个方法,一个是 __new__,一个是 __init__,有什么区别,哪个会先执行呢?


class test(object):
    def __init__(self):
        print("test -> __init__")

    def __new__(cls):
        print("test ->__new__")
        return super().__new__(cls)

a = test()

运行结果如下:

test ->__new__
test -> __init__

再来看另一个例子


class test2(object):
    def __init__(self):
        print("test2 -> __init__")

    def __new__(cls):
        print("test2 ->__new__")
        return object()

b = test2()

运行结果如下:

test2 ->__new__

这里给出官方的解释:__init__ 作用是类实例进行初始化,第一个参数为 self,代表对象本身,可以没有返回值。__new__ 则是返回一个新的类的实例,第一个参数是 cls 代表该类本身,必须有返回值。很明显,类先实例化才能产能对象,显然是 __new__ 先执行,然后再 __init__,实际上,只要 __new__ 返回的是类本身的实例,它会自动调用 __init__ 进行初始化。但是有例外,如果 __new__ 返回的是其他类的实例,则它不会调用当前类的 __init__。下面我们分别输出下对象 a 和对象 b 的类型:

print( type(a))
#<class '__main__.test'>

print( type(b))
#<class 'object'>

可以看出,a 是 test 类的一个对象,而 b 就是 object 的对象。

参考文档:https://docs.python.org/3/reference/datamodel.html?highlight=__new__#object.__new__

2、map 函数返回的对象

map()函数第一个参数是 fun,第二个参数是一般是 list,第三个参数可以写 list,也可以不写,作用就是对列表中 list 的每个元素顺序调用函数 fun 。

>>> b=map(lambda x:x*x,[1,2,3])
>>> [i for i in b]
[1, 4, 9]
>>> [i for i in b]
[]
>>>

有没有发现,第二次输出 b 中的元素时,发现变成空了。原因是 map() 函数返回的是一个迭代器,并用对返回结果使用了 yield,这样做的目的在于节省内存。
举个例子:

#encoding:UTF-8  
def yield_test(n):  
    for i in range(n):  
        yield call(i)  
    #做一些其它的事情      
  
def call(i):  
    return i*2  
  
#使用for循环  
x = yield_test(5)
print([i for i in x])
print([i for i in x])

执行结果为:

 [0, 2, 4, 6, 8]
 []

这里如果不用 yield,那么在列表中的元素非常大时,将会全部装入内存,这是非常浪费内存的,同时也会降低效率。

3、正则表达式中 compile 是否多此一举?

比如现在有个需求,对于文本 <div class=”nam”>中国</div>,用正则匹配出标签里面的“中国”,其中 class 的类名是不确定的。

有两种方法,代码如下:

>>> import re
>>> text = '<div class="nam">中国</div>'
>>> #方法一
...
>>> re.findall('<div class=".*">(.*)</div>',text)
['中国']
>>> #方法二
...
>>> regex='<div class=".*">(.*)</div>'
>>> pattern = re.compile(regex)
>>> re.findall(pattern,text)
['中国']
>>>

这里为什么要用 compile 多写两行代码呢? 原因是 compile 将正则表达式编译成一个对象,加快速度,并重复使用。

4、[[1,2],[3,4],[5,6]]一行代码展开该列表,得出[1,2,3,4,5,6]

>>> [j for i in [[1,2],[3,4],[5,6]] for j in i]
[1, 2, 3, 4, 5, 6]
>>>

5、一行代码将字符串 “->” 插入到 “abcdefg”中每个字符的中间

>>> "->".join("abcdef")
'a->b->c->d->e->f'
>>>

这里也建议多使用 os.path.join() 来拼接操作系统的文件路径。

6、zip 函数

zip() 函数在运算时,会以一个或多个序列(可迭代对象)做为参数,返回一个元组的列表。同时将这些序列中并排的元素配对。zip() 参数可以接受任何类型的序列,同时也可以有两个以上的参数;当传入参数的长度不同时,zip 能自动以最短序列长度为准进行截取,获得元组。


>>> a=[1,2]
>>> b=(3,4)
>>> zip(a,b)
<zip object at 0x000001A20201AA08>
>>> for i in zip(a,b):
...     print(i)
...
(1, 3)
(2, 4)
>>> a="ab"
>>> b="xyz"
>>> for i in zip(a,b):
...     print(i)
...
('a', 'x')
('b', 'y')
>>>

(完)

欢迎关注我的微信公众号 somenzz,一起愉快地玩转 Python 吧。

《6个值得玩味的Python代码》 个人微信公众号.png

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注