col_ = col.strip()\ .replace(',','')\ .replace("'",'')\ .replace("""""""",'')\ .replace('(',' ')\ .replace(')'…
标签:python
使用python-pexpect登录linux系统并发送命令
#!/usr/bin/python # -*- coding: utf-8 -*- # filename: pexpect_test.py import pexpect,time,sys def sendCommt():…
python爬虫之BeautifulSoup
python爬虫之BeautifulSoup 简介 **Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单…
python小记
提示:由于水平有限,如发现有疑问或错误的地方请毫不客气的提出、讨论,我会在第一时间回复,感谢在先 重要的事情说三遍 查看module文档的时候方法执行一定添加() 查看module文档的时候方法执行一定添加() eg: …
python爬虫系列(4.2-python操作csv文件)
一、关于csv文件的介绍 CSV(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。由于是纯文本,任何编辑器也都可打开。与Excel文件不同,CSV文件中: 值没有类型,所有值都是字符…
(译)Python关键字yield的解释--下篇(stackoverflow)
6.回到你的代码 (译者注:这是回答这对问题的具体解释) 生成器: # Here you create the method of the node object that will return the generat…
Python 练习册 6-统计文本文件中单词的次数
Python 练习册,每天一个小程序,原题来自Yixiaohan/show-me-the-code 我的代码仓库在Github 目标 你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,…
Python3.x 基础学习资料整理
之前整理过很多的有关于 Python 的学习资料,都是有关于Python2.x的资料。我们都知道Python3.x已经存在很长一段时间了:Python3.x 改进了的标准库模块、安全性以及 bug 修复。随着 Pytho…
112-模拟字符串lstrip用法
思路: 1、取出字符串长度 2、通过range和字符串长度得到字符串下标 3、找到非空字符串下标,剩余部分取切片 4、如果字符串没有非空字符,返回空串 whitesps = ' \r\n\v\f\t' def rmlsp…
Spark的优化
1.RDD重新分区 针对大量小分区的RDD,使用RDD重分区函数coalesce将小分区合并成大分区;同样当分区数据量过大也可以使用重新分区,增加分区数量,提高并行计算能力。 2.并行度 通过配置和代码来设置task数量…
【每天来点python】递归函数
学习网址:递归函数 注意重点: 递归函数的优点是定义简单,逻辑清晰。理论上,所有的递归函数都可以写成循环的方式,但循环的逻辑不如递归清晰。 使用递归函数需要注意防止栈溢出。在计算机中,函数调用是通过栈(stack)这种数…
批量爬取某(和谐)论坛的美图
功能说明 爬取某个不能说的网站的”新时代的xxx”版块下的所有帖子中的图片 因论坛限制,未注册用户只能访问前100页数据 该文章仅供学习,代码中的地址已做和谐处理,(✿◡‿◡) 第一部分代码 1,…