本文介绍了distinct count的SQL优化方法,以及常用的高效近似算法及其在PostgreSQL上的实现。 UV vs. PV 在互联网中,经常需要计算UV和PV。所谓PV即Page View,网页被打开多少次(…
标签:uv
SparkStreaming+Kafka 实现统计基于缓存的实时uv
我的原创地址:https://dongkelun.com/2018/06/25/KafkaUV/ 前言 本文利用SparkStreaming+Kafka实现实时的统计uv,即独立访客,一个用户一天内访问多次算一次,这个看…
统计PV、UV
使用Hive日常工作基本上都会碰到统计PV、UV的需求,有如下日志表格式表: create table user_log ( log_time string, user_id string, .... ) 统计一段时间内…