linux – 用于最常见的IP地址bash脚本的Apache访问日志

所以我在apache日志文件上运行一个bash脚本我可以对IP地址进行排序并显示最常见但是它显示在页面底部没有顶部如何从最高到最低显示它

到目前为止这是我的剧本

cat access_log.txt | awk '{print $1}'| uniq -c |sort -n -k 1| tail

在我的txt文件中我有

10.23.234.0
250.40.56.78
8.45.98.250
10.23.234.0
250.40.56.78
8.45.98.250
10.23.234.0
250.40.56.78
10.23.234.0
250.40.56.78
10.23.234.0 
10.23.234.0

输出是

2 8.45.98.250
4 250.40.56.78
6 10.23.234.0

我希望输出

6 10.23.234.0
4 250.40.56.78
2 8.45.98.250

也希望这是打印出它旁边的DNS名称的最好方法

66.249.73.234 - - [12/Fegb/2013:12:00:09 +1100] "GET /java/tut/tut.sgml-065.html HTTP/1.1" 200 752 "-" "Mozilla/6.0 (compatible; Googlebot/2.1; +http://www.google.com.html)"  

所以它会

66.249.73.234 - http://www.google.com.html

谢谢

最佳答案 你可以用这个:

awk '{a[$1]++} END {for (i in a) print a[i],i | "sort -rnk1"}' access_log.txt
5 10.23.234.0
4 250.40.56.78
2 8.45.98.250
1 10.23.234.0

要么

awk '{a[$1]++} END {for (i in a) print a[i],i}' access_log.txt | sort -rnk1

排序中的r是相反的

获取HTML数据

awk '{split($0,a,"http|[)]");print $1" - http"a[2]}' file
66.249.73.234 - http://www.google.com/bot.html

顶级打印DNS仅适用于前两个记录.

awk '{split($0,b,"http|[)]");a[$1" - http"b[2]]++} END {for (i in a) print a[i],i}' file | sort -rnk 1 | awk 'NR>2 {$0=$1FS$2} 1'
点赞