学会用Python统计彩票热门数据,冲击人生第一桶金?

又是一周的星期五了,离彩票的开奖时间还有两天,刚好趁机来分析下彩票,以备过两天的彩票开奖。因此,准备了两个脚本,一个用来下载最近的彩票数据,一个用来统计彩票数字,分享给大家!

《学会用Python统计彩票热门数据,冲击人生第一桶金?》

一、彩票数据获取并写入excel表格

数据来源自己看吧~用外链通不过。。。

所用库:xlwt,requests,lxml

有几点需要注意的:

1、构建列表。因为存入excel文件的时候用的是列表,所以新建一个函数,分别取网页5个数据:时间、期数、开奖数123,然后每一页嵌套写入列表类似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取所有的数据!注意构建列表的形式和列表结果,这个在你写入表格的时候很重要!

2、写入数据。xlwt写入文件的方法为ws.write(行,列,数据),按行写入文件,所以新建一个变量line(代码第36行),每写入一行自增1。

其他方面都很简单,没有反爬,就是为了获取数据,好做分析!

《学会用Python统计彩票热门数据,冲击人生第一桶金?》

最后excel表中的数据

是这样的:

《学会用Python统计彩票热门数据,冲击人生第一桶金?》

最后大概有4840行数据,足够我们分析的了!

二、数据处理

用xlrd库就可以~话说xlwt库和xlrd库好像就是一个写数据,一个读数据。。。

就写了一个抓热门数字的,也就是取频率最高的。如果您有更好的想法或者玩法,可以自行去实现哦!

先读取数据,然后取到每一行的2.3.4列,每一列写入一个列表(现在有些后悔,不该写那么多数据进来),然后3个列表合并一个总列表,这样我们就有了4个列表,取出每一个列表中出现次数最多的那个数字,代码如下:

《学会用Python统计彩票热门数据,冲击人生第一桶金?》

第1个数字频率最高的是 [3]

第2个数字频率最高的是 [6]

第3个数字频率最高的是 [8]

单个数字频率最高的是 [3]

因为有点偷懒。。。所以就全部用了列表推导式,也没有用pandas库或者可视化库做出很炫酷的图表,等我研究出完美的预测方案的时候在做【手动哭泣】,不过依现在的走势,是没什么希望了。。。

最后想要和大家分享的是,从开始研究分析各种数据到现在按惯例买彩票,没中过一次大奖(超过200都算大奖,可能也是人有点衰)!所以大家还是得头脑清醒点,要知道天上不会掉馅饼的。。。。。分享到此告一段落!喜欢本文的小伙伴或者觉得本文对你有帮助可以点播关注或转发。

最后

小编精心推荐一个学习Python的好去处,如果有想学Python的,或者想与小编交流的小伙伴可以加群959997225或加小编QQ2789278246!

本文来自网络,如有侵权,请联系小编删除!

    原文作者:松珏
    原文地址: https://www.jianshu.com/p/31b5df0a8ca0
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞