最近做项目遇到一个需求,要求自行统计网站的PV、UV、IP,并显示到后台。于是我们可以通过nginx的日志实现。 概念 UV:独立访客;以cookie为依据,假设一台电脑装有3个不同的浏览器,分别打开同一个页面,将会产生…
标签:pv
SQL优化(二) 快速计算Distinct Count
本文介绍了distinct count的SQL优化方法,以及常用的高效近似算法及其在PostgreSQL上的实现。 UV vs. PV 在互联网中,经常需要计算UV和PV。所谓PV即Page View,网页被打开多少次(…
数据仓库中的SQL性能优化(MySQL篇)
做数据仓库的头两年,使用高配置单机 + MySQL的方式来实现所有的计算(包括数据的ETL,以及报表计算。没有OLAP)。用过MySQL自带的MYISAM和列存储引擎Infobright。这篇文章总结了自己和团队在那段时…
统计PV、UV
使用Hive日常工作基本上都会碰到统计PV、UV的需求,有如下日志表格式表: create table user_log ( log_time string, user_id string, .... ) 统计一段时间内…