摘要:用Python做文本挖掘的流程 收集数据 数据集。如果是已经被人做成数据集了,这就省去了很多麻烦事 抓取。这个是 Python 做得最好的事情,优秀的包有很多,比如 scrapy,beautifulsoup 等等。…
分类:技术干货
PostgreSQL 源码解读(87)- 查询语句#72(PortalRunSelect->ExecutorRun->ExecutePlan函数)
本节介绍了PortalRunSelect->ExecutorRun->ExecutePlan函数以及ExecProcNode的其中一个Real函数(ExecSeqScan)。ExecutePlan函数处理查询…
pyspark
pyspark version 输出spark的版本 print(“pyspark version”+str(sc.version)) map sc = spark context, parall…
浅谈Nginx负载均衡原理与实现
1 负载均衡 先来简单了解一下什么是负载均衡,单从字面上的意思来理解就可以解释N台服务器平均分担负载,不会因为某台服务器负载高宕机而某台服务器闲置的情况。那么负载均衡的前提就是要有多台服务器才能实现,也就是两台以上即可。…
大数据学习资源最全版本(收藏)
资源列表: 关系数据库管理系统(RDBMS) 框架 分布式编程 分布式文件系统 文件数据模型 &nb…
_Pragma 之location字段——(IAR使用基础篇)
最近有项目用到IAR开发环境,之前用的是KEIL,许多针对编译器的指令不是很清楚。 今天我们就来学习编译指示指令:location 代码如下: #define USB_GLOBAL _Pragma("location =…
Charles使用教程及Https乱码解决
Charles的使用教程 手机端代理工具Charles(俗称花瓶)的详细使用教程及问题解决汇总(v4.2.1,iOS10.3) — by Qzx 参考网址 Charles 官网 — 推荐支持正版 …
iOS物联网之CRC效验
此文为代码记录,需要使用到CRC的朋友可以直接拷贝使用。 CRC.h 是以下代码: #ifndef CRC_h #define CRC_h #include <stdio.h> unsigned short …
Python学习记录-FIFOQueue ...
Tensorflow tf.FIFOQueue FIFOQueue类基于基类QueueBase.QueueBase主要包含入列(enqueue)和出列(dequeue)两个操作.enqueue操作返回计算图中的一个Ope…
Python实现一个代码行数统计工具
我们经常想要统计项目的代码行数,但是如果想统计功能比较完善可能就不是那么简单了, 今天我们来看一下如何用python来实现一个代码行统计工具。 思路:首先获取所有文件,然后统计每个文件中代码的行数,最后将行数相加. 实现…
Ubuntu18.04 + MySQL + phpMyAdmin + Nginx
Ubuntu18.04 + MySQL + phpMyAdmin + Nginx 安装 软件 apt install nginx add-apt-repository ppa:ondrej/php apt-get upd…
利用DOM API实现两个jQuery API
本篇文章将介绍如何使用浏览器提供的原生DOM API来实现jQuery的两个实用的API。 通过了解DOM API,我们可以…