我有一个非常大的数据库,在一个表中有大约1.2亿条记录.在将它分成几个表(可能将其标准化)之前,我先清理该表中的数据.该表的列如下:“id(主键),userId,Url,Tag”.这基本上是来自美味网站的数据集的子集.正如我所说的,每行都有一个id,userID是一个url,只有一个标签.例如,美味网站中的书签由单个URL的几个标签组成,这对应于我的数据库的几行.例如:
"id"; "user" ;"url" ;"tag" "38";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"ajax" "39";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"api" "40";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"javascript" "41";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"library" "42";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"rails"
我需要一个查询来计算标记用于网址的次数.
谢谢你的帮助
最佳答案 此查询应该适合您:
SELECT tag, url, count(tag) FROM table GROUP BY tag, url
虽然没有为你测试过.