运维的敲门砖--Zabbix

其实在几年前,就有组里的同事研究过Zabbix,可是随着他的离职,就没有人清楚了。虽然给客户的版本,我们都会验证snmp的mib节点get的情况,可是却总是被客户抱怨有问题。索性自己安装一下Zabbix,主要是为了定位客户问题,也想通过它来了解一些运维的知识。

1

网上指导安装Zabbix的的文档一大把,首先我装的是Zabbix 2.0版本。接下来,通过配置host/template/Item直到关联到graph,终于在网页上看到了Zabbix收集交换机内存使用率和CPU使用率的曲线,和之前简单的snmpwalk/snmpget到一个值的感觉完全不一样!尤其是在做稳定性测试的时候,无疑是多了一个track的途径。Template的概念真是好,只要有了一套template,要增加对一台交换机的监控并应用这个template,就全部搞定了。

2

后来在和客户的交谈中,了解到Zabbix3.0可以发现交换机的端口(因为交换机的40G/100G端口支持拆分,所以有多少port是不确定的),然后对每个端口都可以应用对应的检测项。在Ubuntu上试图装3.0,搞了半天都没有装好,后来是在CentOS7上参考这篇文章 才搞定。
多说一句,如果遇到下面的问题,就

[root@localhost zabbix-server-mysql-3.0.8]# sudo systemctl start zabbix-server
Job for zabbix-server.service failed because a configured resource limit was exceeded. See "systemctl status zabbix-server.service" and "journalctl -xe" for details.
[root@localhost zabbix-server-mysql-3.0.8]# 
[root@localhost zabbix-server-mysql-3.0.8]# 
[root@localhost zabbix-server-mysql-3.0.8]# 
[root@localhost zabbix-server-mysql-3.0.8]# chown -R zabbix:zabbix /var/log/zabbix
[root@localhost zabbix-server-mysql-3.0.8]# chown -R zabbix:zabbix /var/run/zabbix
[root@localhost zabbix-server-mysql-3.0.8]# chmod -R 775 /var/log/zabbix/
[root@localhost zabbix-server-mysql-3.0.8]# chmod -R 775 /var/run/zabbix/
[root@localhost zabbix-server-mysql-3.0.8]# /usr/sbin/zabbix_agentd -c /etc/zabbix/zabbix_agentd.conf
[root@localhost zabbix-server-mysql-3.0.8]# Disable Selinux
bash: Disable: command not found...
[root@localhost zabbix-server-mysql-3.0.8]# 
[root@localhost zabbix-server-mysql-3.0.8]# systemctl start zabbix-server
[root@localhost zabbix-server-mysql-3.0.8]# 

忍不住吐槽一下,不能随便访问外网,装点东西就是累。
客户非常nice,直接把导出的template-xml文件发给了我。

  • 端口有很多的检测项,如何能一次定义,然后应用到所有端口?关键是prototypes!

    《运维的敲门砖--Zabbix》 z1.png

  • 其中Item prototypes包含了对端口的通用检测项

    《运维的敲门砖--Zabbix》 z2.png

  • 以其中”ifHCOutOctets”为例,可以看到定义过程中用的都是[{#IFNAME}]变量

    《运维的敲门砖--Zabbix》 z3.png

  • interface的列表信息,由item获取

    《运维的敲门砖--Zabbix》 z4.png

  • 如果想用图形监控进出的流量,那么就创建graph prototypes

    《运维的敲门砖--Zabbix》 z5.png

  • 这样在monitoring中,针对每个端口(当然要在端口信息获取之后),就都有一个监控进出流量的graph了

    《运维的敲门砖--Zabbix》 z6.png

3

有了Zabbix这个利器,发现了之前没有注意到的SNMP的一些问题,或是功能性的,或是性能方面的。我真切体会到“工欲善其事,必先利其器”这句话的含义。因此在客户支持的过程中,一定要注意搜集客户的测试运维工具,充实自己的“武器库”。

    原文作者:ljyfree
    原文地址: https://www.jianshu.com/p/3c97a8ec6c5b
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞