C++程序员Python notes

2023年5月16日 123次阅读来源: magicyang87

参考http://blog.chinaunix.net/uid/20039893/frmd/49956.html及其他一些网上资料，C++程序员的Python入门。

1. important getchas:
    judge whether a object is a type
    type(object) == type(str())
    或
    from types import StringTypes
    type(object) == types.StringType    #记得要import types
    或if isinstance(obj， StringTypes)：
    与系统定义的单值比较尽量使用is，虽然使用==能使用同样功能但效率差许多，因为一个是直接比较一个需要调用其比较函数，老外曾经测试过。如if x is None，if x is not None，不要if x == None。is的非形式为is not。
    所有的控制语句需要用’:’换行，定义函数同样，切记，Python中的一切都是对象，包括函数。
    尽量使用xrange代替range，range直接生成指定大小的list，而xrange只是生成一个对象而在需要时才产生下一个值，这可以节省非常多的内存，对于足够大的值使用range可能造成内存不足。
    编码规范：类名首字母大写，e.g. ，Dog，变量和函数名__开头为私有，尽量只将函数暴露给外部，变量命名小写加_即可，同Linux。某些时候和系统的命名冲突可以_结尾，如_china_。
http://www.cnblogs.com/kym/archive/2011/03/17/1986640.html

2. itertools模块对迭代和组合非常有效，比如
    import itertools
    iter = itertools.permutations([1, 2, 3])
    lst = list(iter)    #此时lst为[1, 2, 3]的全排列

3. 数组即list，下标中的冒号表示到XX为止或以XX开始
    string中单个item是不可修改的，故不可使用str_test[5] = ‘m’来修改一个字节
    正确的方式是str_test = str_test[4:] + ‘m’ + str_test[:6]
    但这种方法会多次拷贝字符串造成效率较低，故较好的方法是先用list存储之后再转
    其长度并非list.len而是len(list)

4. sequence类型的slice详解，比如string、list、tuple
1）+不能用来连接一个字符串和数字，因为其也数字加法运算符
2）[1：4：2]除起始两个值代表起始和结束位置外，最后一个代表步进值

5. Python数据类型分类
    number
    sequence： string（不可变）、list、tuple（不可变）
    mapping： dictionary，类似stl中的map
    可变和不可变类似于c++中的const，即一旦定义后不许改变其值。
    number支持各种算术运算。
    string是顺序的，不可变的。
    list是顺序的，可变的。
    dictrionary是无顺序的，可变的
    tuple是顺序的，不可变的。
    str() list() dict() tuple()这几内置函数分别用于构造相应的类型。

6. list
    特点：有序、可变
    可直接使用list将序列构造一个list，如：test_list = list(‘china’)
    修改时可直接以slice为单位，且不要求被替换的内容与新内容长度相同，故修改后可能list的长度会改变，如：test_list[4:6] = [‘n’, ‘a’, ‘m’, ‘mddd’]或test_list[4:] = [‘e’]
    注意list中的count并非其中的元素个数，而是给定的value在list中出现的次数
    其他如下：

>>> L.append(4) #只能一次添加一个object,不能用于两个sequence连接，因为新sequence将会被作为一个object添加进去
>>> L
[0, 1, 2, 3, 4]
>>> L.extend([5, 6]) #参数为一个sequence，直接添加到其末尾
>>> L
[0, 1, 2, 3, 4, 5, 6]
>>> L = L + [7] #可为sequence或object，与前面的区别是会新构造一个对象，故需要重新赋值，至于+=是否会被当作append或extend处理目前并未有相关资料，如果作者有注意到的话应该会做此类优化
>>> L
[0, 1, 2, 3, 4, 5, 6, 7]

7. dictionary
    初始化方式为test_dic = {1:’one’, 2:’two}
    可以使用items()导出到list， test_list = test_dic.items()，将会得到一个类似[(1, ‘one’), （2, ‘two’)]的list。
    可以使用fromkeys()从list导入key，value将以None填充，如：
    test_list = [1, 2, 3, 4]
    test_dic.fromkeys(test_list)
    for x in test_dic会遍历test_dic，默认遍历key，使用test_dic的iterkeys()、itervalues()、iteritems()可以分别得到遍历key、value和item的iterator。

8. tuple
    test_tuple = (1, 3, 4)
    可将tuple理解成const的list，但其成员的成员是可变，即其某一位置必须指向某一对象不可再指向另一对象，但该对象本身是可变的。
    注意当只有一个初始成员时需要在初始化末尾加’,’，如：
    test_tuple = (1, )
    否则将会被初始化为整型。

9. 查找一个值是否在容器中要用in而不是用index然后去检查其返回值是不是>0…

10. print a, b, c,    print会自动在每个变量后加一个空格，最后以逗号结尾可以防止调用print结束会自动附加的\n换行符
    print >> object, x, y    将x,y出到object的write方法中，该ojbect必须有些方法哦
    Python中print为以下语句的简写
    import sys
    sys.stdout.write(str(x) + ‘\n’)
    故可通过将stdout重定向而实现print的输出重定向功能
    import sys
    fp = file(‘log.txt’, ‘a’)
    sys.stdout = fp
    print ‘hello world! heihei’
    sys.stdout = sys.__stdout__    # reset to default

11. 语句和语法
    Python要写超过一行的语句，需要一对符号的语句或者在前一行后加上’\’，与C相同，第二种不推荐，因为任何第二种的情况都可使用（）来代替
    Python中的switch/case可用多个if/elif/else代替，或者个人感觉可以使用dictionary结合lambda表达式，如：
    choice = ‘inc’
    g = {‘inc’ : lambda x: x + 1,
     ‘dec’ : lambda x: x – 1}
    g[choice](x)
    Python中的while和for都可带else子句，注意break是不会跳到else中的，只有循环的判断表达式为False方可。

12. map(function, seq1, seq2, …) 对seq列表中的所有的的seq每项依次调用function，将其返回值构建列表，如果functon为None则直接返回seq中的值
map(lambda x, y: y / x, time, ratio) #每个时刻点的平均ratio

13. zip就是把2个数组糅在一起
x=[1, 2, 3, 4, 5 ]
y=[6, 7, 8, 9, 10]
zip(x, y)就得到了
[(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]
比如你有2组坐标，你想两两对应的相加，那么zip函数就很有用了。
再比如，你有2个数组A,B，A存了班级里的人的名字，B是每个人的考试分数，你需要通过某个人的名字来查考试分数，那你需要一个字典，zip可以很方便地帮你建立字典：
>>> x=[‘bob’,’tom’,’kitty’]
>>> y=[80,90,95]
>>>d=dict(zip(x,y))
[(‘bob’, 80), (‘tom’, 90), (‘kitty’, 95)]
>>> d[‘bob’]
返回80，多方便啊

14. 在Python中所有的都是对象，函数也不例外。
def定义一个函数对象，定义的对象可赋值，lambda函数同理。

if x ==0:
def npower(n): x**2
else:
def npower(n): x**3
nload = npower
nload(5)
L = [npower, nload]

15. 命名空间
第一，赋值（包括显式赋值和隐式赋值）产生标识符，赋值的地点决定标识符所处的命名空间。
第二，函数定义（包括def和lambda）产生新的命名空间。
第三，python搜索一个标识符的顺序是”LEGB”。
所谓的”LEGB”是python中四层命名空间的英文名字首字母的缩写。最里面的一层是L（local），表示在一个函数定义中，而且在这个函数里面没有再包含函数的定义。第二层E(enclosing function)，表示在一个函数定义中，但这个函数里面还包含有函数的定义，其实L层和E层只是相对的。第三层G(global)，是指一个模块的命名空间，也就是说在一个.py文件中定义的标识符，但不在一个函数中。第四层B（builtin），是指python解释器启动时就已经具有的命名空间，之所以叫builtin是因为在python解释器启动时会自动载入__builtin__模块，这个模块中的list、str等内置函数的就处于B层的命名空间中。
其实只要在编程的时候注意一下，不要使用相同的标识符，基本上就可以避免任何与命名空间相关的问题。还有就是在一个函数中尽量不要使用上层命名空间中的标识符，如果一定要用，也最好使用参数传递的方式进行，这样有利于保持函数的独立性。

16. 函数传参方式
关键字赋值法：不像C/C++，形参的顺序是可根据传参顺序改变，如：F(arg2 = 2, arg1 = 1)
F(arg1,arg2,…)
F(arg2=<value>,arg3=<value>…)    #带默认值的函数定义，如果需要用到默认值的参数在前面，则使用关键字赋值法
F(*arg1)    #参数不管多少个都被存放在以形参名为标识符的tuple中
F(**arg1)    #参数不管多少个都被存放在以形参名为标识符的dictionary中，调用时需要采用F(x = 1, y = 2)类似的形式，则arg1 = {(‘x’ : 1), (‘y’ : 2)}

17. lambda函数
与C++不同，lambda在Python中只能是一行，可以使用’;’，但不能使用for/while/if，虽然使用某些技巧可以实现但不推荐，系统自带的map/reduce/filter等函数比较好用。
lambda x, y: x + y; print x, y; x + y + 1

18. 类相关
__init__(self) 类的构造函数，如果传参可写为__init__(self, arg1, arg2…)，类似于c++中的bind。
__del__(self) 类的析构函数
__call__(self, arg1, …) 类似于C++中的重载括号运算符
类中的权限完全根据_和__来区分，即直接命名的为public函数
派生类需要手动调用基类的__init__，否则继承将不起作用

class Animal(object):

    name = 'unname' # member varieble

    def __init__(self, voice = 'hello', name = 'default'):

        self.voice = voice

        print 'animal::__init__, name: ', name

    def __call__(self, voice)

        self.voice = voice

    def say(self):

        print self.voice

        print self.name

class Dog(Animal):

    def __init__(self):

        #Animal.__init__(self)    # 手动调用

        super(Dog, self).__init__()    #代替上面的写法

        self.dogName = 'dogName'

Dog d

d('wangwang')    # invoke __call__

d.say()

    原文作者：magicyang87
    原文地址: https://blog.51cto.com/magicyang/1050798
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。