python统计代码行数

改良后的代码可以对python和C系列的代码实行行数计算,包括代码、空行和注释行,用re抓取注释,传入一个目录自动对其下的文件进行读取计算

流程

首先判断传入参数是否为文件夹,不是则打印出提示,否则继续(无返回),获得目录后,yongos.listdir对路径下文件进行遍历,其中也包含文件夹,再次判断是否为文件夹,是的话则递归调用此函数,否则开始执行行数统计,这里用os.path.join将路径与文件名进行拼接,方便之后直接传给函数,逻辑很简单,无非是执行文件判断,判断是哪类文件,在调用对应的注释监测正则代码段进行抓取,抓取到则行数+1,空白行也是一样的原理,用strip(去除前后空格),然后行内内容为空则为空行,代码段即为总行数减去其他两类行数,最后在外层将所有文件对应的代码段累加即为total

关键

函数内部是可以访问全局变量的,问题在于函数内部修改了变量,导致python认为它是一个局部变量。

  • 所以,如果在函数内部访问并修改全局变量,应该使用关键字 global 来修饰变量
import os
import re

#定义规则抓取文件中的python注释
re_obj_py = re.compile('[(#)]')
#定义规则抓取文件中的C语言注释
re_obj_c = re.compile('[(//)(/*)(*)(*/)]')


#判断是否为python文件
def is_py_file(filename):
    if os.path.splitext(filename)[1] == '.py':
        return True
    else:
        return False

#判断是否为c文件
def is_c_file(filename):
    if os.path.splitext(filename)[1] in ['.c', '.cc', '.h']:
        return True
    else:
        return False

#定义几个全局变量用于计算所有文件总和(全部行数、代码行数、空行数、注释行数)
all_lines, code_lines, space_lines, comments_lines = 0, 0, 0, 0

#判断是否为文件夹,不是则输出提示
def count_codelines(dirpath):
    if not os.path.isdir(dirpath):
        print('input dir: %s is not legal!' % dirpath)
        return
    # 定义几个全局变量用于计算每个文件行数(全部行数、代码行数、空行数、注释行数)
    global all_lines, code_lines, space_lines, comments_lines
    #列出当前文件夹下的文件(包含目录)
    all_files = os.listdir(dirpath)
    for file in all_files:
        #将文件(目录)名与路径拼接
        file_name = os.path.join(dirpath, file)
        if os.path.isdir(file_name):
            count_codelines(file_name)
        else:
            temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines = 0, 0, 0, 0
            f = open(file_name)
            for line in f:
                temp_all_lines += 1
                if line.strip() == '':
                    temp_space_lines += 1
                    continue
                if is_py_file(file_name) and re_obj_py.match(line.strip()):
                    temp_comments_lines += 1
                if is_c_file(file_name) and re_obj_c.match(line.strip()):
                    temp_comments_lines += 1
            temp_code_lines = temp_all_lines - temp_space_lines - temp_comments_lines
            print('%-15s : all_lines(%s)\t code_lines(%s)\t space_lines(%s)\t comments_lines(%s)'
                  % (file, temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines))

            all_lines += temp_all_lines
            code_lines += temp_code_lines
            space_lines += temp_space_lines
            comments_lines += temp_comments_lines



if __name__ == '__main__':
    count_codelines('test')
    print('\n**** TOTAL COUNT ****\nall_lines = %s\ncode_lines = %s\nspace_lines = %s\ncomments_lines = %s' % (all_lines, code_lines, space_lines, comments_lines))



点赞