在 SQLAlchemy 中执行查询是通过 session 对象的 query 方法完成的。 遍历 for user in session.query(User).order_by(User.id): print(use…
标签:user
hive操作数据
create table user_info (user_id int, cid string, ckid string, username string) row format delimited fields ter…
scrapy使用随机User-Agent
scrapy使用随机User-Agent 众所周知,User-Agent值是用来帮助服务器识别用户使用的操作系统、浏览器、浏览器版本等等信息的,因此也常被用来检测爬虫。 许多网站会ban掉来自爬虫的请求,来达到反爬的目的…
Rails:Session工作原理
How Rails Sessions Work 如果你的Rails应用不知道谁在访问它?如果同一个人请求两个不同的页面你不知道怎么处理?如果接到回应后所有保存的数据都消失? 对于大部分静态站点来说这没什么大不了的。但是大…
RPC Benchmark Round 5
测试说明 仅限于 Java 客户端使用 JMH 进行压测, 32 线程, 3 轮预热 3 轮测试, 每轮 10s 每次运行前都会执行 killall java, 但没有在每轮测试时重启操作系统 所有类库版本在发布时都是最…
hbase simple权限二
一:HBASE权限user HBASE的user底层使用的还是hadoop的user; 构造connection类: public static Connection createConnection(Configura…
理解目录/user/hive/warehouse/与表的关系
查看目录与表 hive> dfs -ls /user/hive/warehouse/ > ; Found 10 items drwxr-xr-x - root supergroup 0 2017-09-29 …
设置Gradle的本地仓库路径
gradle的默认仓库路径为用户目录下的.gradle目录,gradle并没有像maven那样提供配置文件,若要修改默认仓库路径,我们可以设置环境变量GRADLE_USER_HOME,windows下同理。我把仓库设置在…
Scrapy爬虫错误:403 FORBIDDEN 与 User-agent
403 Forbidden The server understood the request but refuses to authorize it. Troubleshooting 在setting.py文件中增加U…
scrapy设置时间间隔
当使用scrapy大规模爬取某一站点的页面时,有时候会因爬取过于频繁而被封IP,导致出现400等错误。 此时的解决思路之一就是让蜘蛛在访问网址中间休息1~2秒。 还有就是配置User Agent,尽量轮换使用不同的Use…
MySQL 非主键索引更新引起的死锁
表结构如下: CREATE TABLE `user_item` ( `id` BIGINT(20) NOT NULL, `user_id` BIGINT(20) NOT NULL, `item_id` BIGINT(20…
MongoDB大批量读写数据优化记录
用批量写入代替单个写入 最开始,我的代码逻辑是这样的: for uid, data in user_dict.items(): user_collection.insert_one({'uid':uid, 'user_d…