【Linux】分布式监控 Zabbix | 您所在的位置:网站首页 › zabbix监控的原理 › 【Linux】分布式监控 Zabbix |
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 Zabbix 介绍zabbix 概述Zabbix 监控原理Zabbix 6.0 新特性Zabbix 6.0 功能组件 Zabbix 6.0 部署Zabbix 添加客户端主机Zabbix 自定义监控内容Zabbix 自动发现与自动注册Zabbix 部署代理服务器部署 Zabbix 高可用集群 Zabbix 介绍作为一个运维,需要会使用监控系统查看服务器系统性能、应用服务状态和网站流量指标等,利用监控系统的数据去了解网站上线发布的结果和健康状态。 利用一个优秀的监控软件,我们可以: ●通过一个友好的界面进行浏览整个网站所有的服务器状态 ●可以在 Web 前端方便的查看监控数据 ●可以回溯寻找事故发生时系统的问题和报警情况 zabbix 概述●zabbix 是一个基于 Web 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 ●zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 ●zabbix 由 2 部分构成,zabbix server 与可选组件 zabbix agent。通过 C/S 模式采集数据,通过 B/S 模式在 Web 端展示和配置。 ●zabbix server 可以通过 zabbix agent,SNMP协议,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux 等平台上。 ●zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU 等信息的收集。 zabbix agent 安装在被监控的主机上,zabbix agent 负责定期收集客户端本地各项数据,并发送至 zabbix server 端,zabbix server 收到数据后, 将数据存储到数据库中,用户基于 Zabbix Web 可以看到数据在前端展现图像。当 zabbix 监控某个具体的项目, 该项目会设置一个触发器阈值, 当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(shell 命令、reboot、restart、 install 等)。 1、Zabbix server高可用防止硬件故障或计划维护期的停机: ●原生选择加入HA群集配置 ●定义一个或多个备用节点 ●实时监控Zabbix server群集节点的状态 ●不需要外部工具即可将Zabbix server配置为HA群集模式 2、Zabbix 6.0 LTS新增Kubernetes监控功能,可以在Kubernetes系统从多个维度采集指标: ●Kubernetes节点和pods的自动发现和监控 ●无代理方式采集Kubernetes pods和节点的信息 ●获取Kubernetes节点主机高水平信息 Zabbix 6.0 功能组件●Zabbix Server zabbix 服务端守护进程,是 Zabbix 软件的核心组件,Zabbix Agent 向其报告可用性、系统完整性信息和统计信息。 Zabbix Server 也是存储所有配置信息、统计信息和操作信息的核心存储库。 Zabbix Server 也是 Zabbix 监控系统的告警中心。在监控的系统中出现任何异常,将发出通知给管理员。 基本的 Zabbix Server 的功能分解成为三个不同的组件。他们是:Zabbix server、Web 前端、数据库。 Zabbix 的所有配置信息都存储在 Server 和 Web 前端进行交互的数据库中。例如,当你通过 Web 前端(或者API)新增一个监控项时, 它会被添加到数据库的监控项表里。然后,Zabbix server 以每分钟一次的频率查询监控项表中的有效项,接着将它存储在 Zabbix server 中的缓存里。 这就是为什么 Zabbix 前端所做的任何更改需要花费两分钟左右才能显示在最新的数据段的原因。 ●数据库 所有配置信息以及 Zabbix 采集到的数据都被持久存储在数据库中。 可以支持 MySQL、PostgreSQL、Oracle、DB2、TimescaleDB 等多种数据库。 ●Web 界面 Web 界面是 Zabbix Server 的一部分,用于实现展示和配置的界面。通常(但不一定)和 Zabbix server 运行在同一台物理机器上。 基于 Apache/Nginx + PHP 实现,早期只支持 LAMP 架构,从 Zabbix5.0 开始支持 LNMP 。 ●Zabbix Agent 客户端守护进程,部署在被监控目标上,用于主动监控本地资源和应用程序,并将收集的数据发送给 Zabbix Server。从 Zabbix5.0 开始支技 Zabbix Agent2 。 ●Zabbix Proxy zabbix 分布式代理守护进程,可以代替 Zabbix Server 采集性能和可用性数据。Zabbix Proxy 在 Zabbix 的部署是可选部分。 Zabbix Proxy 的部署可以很好的分担单个 Zabbix Server 的负载。 通常监控大于 500 台主机时使用,需要进行分布式监控架构部署。 ●Java Gateway Zabbix 要监控 Tomcat 服务或其它 JAVA 程序(比例 Elasticsearch、ZooKeeper),需要使用 Java Gateway 做为代理,才能从 JAVA 程序中获取数据。 Zabbix 6.0 部署●系统:CentOS 7 不支持 yum 方式安装 Zabbix 6.0 服务端 ●安装方式:Zabbix 服务端采用编译安装的方式,zabbix 客户端采用 yum 安装的方式 //关闭 selinux 与防火墙 systemctl disable --now firewalld setenforce 0 hostnamectl set-hostname zbx-server //部署 Nginx + PHP 环境并测试 #安装 nginx cat > /etc/yum.repos.d/nginx.repo index index.php; } location ~ \.php$ { fastcgi_pass 127.0.0.1:9000; fastcgi_index index.php; fastcgi_param SCRIPT_FILENAME /var/www/zbx$fastcgi_script_name; include fastcgi_params; } } #修改 php 配置 vim /etc/php-fpm.d/www.conf user = nginx group = nginx vim /etc/php.ini max_execution_time = 300 # 368行 max_input_time = 600 # 378行 post_max_size = 80M # 656行 date.timezone = Asia/Shanghai # 877行 #创建目录和测试文件 mkdir -p /var/www/zbx vim /var/www/zbx/index.php #启动服务 systemctl enable --now nginx php-fpm #测试访问(hosts解析) 修改 C:\Windows\System32\drivers\etc\hosts 192.168.142.70 zbx.ztm.com 浏览器访问:http://zbx.ztm.com/index.php![]() ![]() 4.创建图形 点击上方菜单栏【图形】,点击【创建图形】 【名称】设置成 Number of login users 【宽】、【高】可直接采用默认值 【监控项】点击添加勾选相关监控项 Number of login users,【功能】选择 最大,其它可保持默认值 点击 【添加】 5.将主机与模板关联起来(一个主机可以关联多个模板) 点击左边菜单栏【配置】中的【主机】,点击你要关联的主机 【模板】搜索 login,选择 Template Login User,点击【更新】 此时就点击【监测】中的【主机】,点击你关联主机的【图形】,即可查看到相关的监控项指标 点击左边菜单栏【管理】中的【报警媒介类型】,点击【创建媒体类型】 【名称】设置成 qq_Email 【SMTP服务器】设置成 smtp.qq.com 【SMTP服务器端口】设置成 25 【SMTP HELO】设置成 qq.com 【SMTP电邮】设置成 自己的邮箱地址,例如 [email protected] 【认证】选择 用户名和密码 【用户名称】设置成 自己的邮箱地址,例如 [email protected] 【密码】可登录QQ邮箱页面,点击【设置】–>【账户】中的【生成授权码】,通过短信获取授权码 【描述】可自定义 点击上方菜单栏【Message templates】,点击【添加】,【Message type】选择 问题,点击【更新】 点击 【添加】,并测试功能 点击左边菜单栏【User settings】–>【Profile】–>【报警媒介】,点击【添加】 【类型】选择 qq_Email 【收件人】设置成 [email protected] 【当启用时】设置成 1-7,00:00-24:00 【如果存在严重性则使用】勾选需要的严重性 点击 【添加】 再点击 【更新】 点击左边菜单栏【配置】->【动作】->【Trigger actions】 选择相对应的动作名称点击进入,点击 【添加】 【类型】选择 触发器,【操作者】选择 等于,【触发器】点击选择 Nunber of login users is greater than 3 点击【添加】 勾选 【已启动】 点击 【更新】 //测试邮件报警 增加测试客户端的用户登录数超过触发器预设的值,查看【监测】–>【仪表板】,确认报警 //zabbix 自动发现(对于 agent2 是被动模式) zabbix server 主动的去发现所有的客户端,然后将客户端的信息登记在服务端上。 缺点是如果定义的网段中的主机数量多,zabbix server 登记耗时较久,且压力会较大。 systemctl disable --now firewalld setenforce 0 hostnamectl set-hostname zbx-agent021.确保客户端上的 zabbix-agent2 服务状态正常 systemctl is-active zabbix-agent2.service active2.在 Web 页面删除原有的客户端主机 点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除3.在服务端和客户端上配置 hosts 解析 vim /etc/hosts 192.168.142.70 zbx-server 192.168.142.60 zbx-agent01 192.168.142.50 zbx-agent024.在 Web 页面配置自动发现 点击左边菜单栏【配置】中的【自动发现】,点击【创建发现规则】 【名称】设置成 mynetwork 【IP范围】设置成 192.168.142.1-254 【更新间隔】设置成 30s 【检查】点击【添加】,【检查类型】选择 Zabbix 客户端,【端口范围】设置成 10050,【键值】设置成 system.uname 【设备唯一性准则】选择 IP地址 【主机名称】选择 DNS名称 【可见的名称】选择 主机名称 勾选 【已启用】,点击 【添加】 点击左边菜单栏【配置】中的【动作】,上方菜单选择 【发现动作】 勾选 【Auto discovery. Linux servers.】,点击 【启用】 点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机 可在服务端查看 zabbix 日志 tail -f /var/log/zabbix_server.log ...... 6601:20210922:225044.115 enabling Zabbix agent checks on host "zbx-agent02": interface became available//zabbix 自动注册(对于 agent2 是主动模式) zabbix agent2 会主动上报自己的信息,发给 zabbix server。 缺点是可能因为配置文件配置错误或者网络不通等原因导致 zabbix agent2 可能找不到 zabbix server。 1.环境准备 点击左边菜单栏【配置】中的【发现动作】,勾选发现规则,点击 禁用 点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除 vim /etc/hosts 192.168.142.70 zbx-server 192.168.142.60 zbx-agent01 192.168.142.50 zbx-agent022.修改 zabbix-agent2 配置文件 vim /etc/zabbix/zabbix_agent2.conf ...... HostnameItem=system.hostname #152行,取消注释 egrep -v "^#|^$" /etc/zabbix/zabbix_agent2.conf PidFile=/var/run/zabbix/zabbix_agent2.pid LogFile=/var/log/zabbix/zabbix_agent2.log LogFileSize=0 Server=192.168.142.70 ServerActive=192.168.142.70 Hostname=zbx-agent01 HostnameItem=system.hostname Include=/etc/zabbix/zabbix_agent2.d/*.conf ControlSocket=/tmp/agent.sock systemctl restart zabbix-agent23.在 Web 页面配置自动注册 点击左边菜单栏【配置】中的【动作】,上方菜单选择 【自动注册动作】,点击【创建动作】 【名称】设置成 Auto registration 点击 【添加】,【类型】选择 主机名称,【操作者】选择 包含,【值】设置成 zbx-agent 点击上方菜单栏【操作】,点击【添加】,【操作类型】选择 添加主机,点击 【Add】 再点击【添加】,【操作类型】选择 添加到主机群组,【主机群组】选择 Linux servers,点击 【Add】 再点击【添加】,【操作类型】选择 与模板关联,【模板】搜索 Linux,选择 Linux by Zabbix agent,点击 【Add】 点击下方的【添加】 等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,即可刷新出自动发现的客户端主机 在服务端查看 zabbix 日志 tail -f /var/log/zabbix_server.log Zabbix 部署代理服务器分布式监控的作用: ●分担 server 的集中式压力 ●解决多机房之间的网络延时问题 agent --> proxy --> server systemctl disable --now firewalld setenforce 0 hostnamectl set-hostname zbx-proxy #设置 zabbix 的下载源,安装 zabbix-proxy rpm -ivh https://repo.zabbix.com/zabbix/6.0/rhel/7/x86_64/zabbix-release-6.0-4.el7.noarch.rpm sed -i 's#https://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo yum install -y zabbix-proxy-mysql zabbix-sql-scripts zabbix-selinux-policy #部署数据库,要求 MySQL 5.7 或 Mariadb 10.5 及以上版本 #配置 Mariadb yum源 cat > /etc/yum.repos.d/mariadb.repo Y (设置root密码,如abc123) -> 后面一路 Y mysql -u root -pabc123 #创建数据库并指定字符集 CREATE DATABASE zabbix_proxy character set utf8 collate utf8_bin; #创建 zabbix 数据库用户并授权 GRANT all ON zabbix_proxy.* TO 'zabbix'@'localhost' IDENTIFIED BY 'zabbix'; GRANT all ON zabbix_proxy.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix'; FLUSH PRIVILEGES; #导入数据库信息 rpm -ql zabbix-sql-scripts #查询 sql 文件的位置 cat /usr/share/zabbix-sql-scripts/mysql/proxy.sql | mysql -uroot -pabc123 zabbix_proxy #修改 zabbix-proxy 配置文件 vim /etc/zabbix/zabbix_proxy.conf Server=192.168.142.70 #32行,指定 zabbix 服务端的 IP 地址 Hostname=zbx-proxy #42行,指定当前 zabbix 代理服务器的主机名 DBPassword=zabbix #194行,指定当前数据库 zabbix 用户的密码 #启动 zabbix-proxy systemctl start zabbix-proxy systemctl enable zabbix-proxy #在所有主机上配置 hosts 解析 vim /etc/hosts 192.168.142.70 zbx-server 192.168.142.60 zbx-agent01 192.168.142.50 zbx-agent02 #在 Web 页面配置 agent 代理 点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用 点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除 点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】 【agent代理程序名称】输入 zbx-proxy 【系统代理程序模式】选择 主动式 【代理地址】输入 192.168.142.50 点击 【添加】 #配置 agent 使用 proxy 1.在客户端修改 agent2 配置文件 vim /etc/zabbix/zabbix_agent2.conf ...... Server=192.168.142.50 #80行,指定 zabbix 代理服务器的 IP 地址 ServerActive=192.168.142.50 #120行,指定 zabbix 代理服务器的 IP 地址 2.在 Web 页面配置 点击左边菜单栏【配置】中的【主机】,点击【创建主机】 【主机名称】输入 zbx-agent01 【可见的名称】输入 zbx-agent01 【模板】搜索 Linux ,选择 Linux by Zabbix agent 【群组】选择 Linux server 【Interfaces】选择 客户端,【IP地址】输入 192.168.142.60,【端口】输入 10050 【由agent代理程序监测】选择 zbx-proxy 点击 【添加】 3.分别在客户端和代理服务器上重启服务 systemctl restart zabbix-agent2 systemctl restart zabbix-proxy 等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常 在服务端查看日志 tail -f /var/log/zabbix/zabbix_proxy.log 部署 Zabbix 高可用集群官方的高可用仅仅针对 Zabbix Server 部分,数据库部分和前端部分需要自行采用各自领域的高可用解决方案。 #服务端配置 默认情况下,HA 是关闭的。HA 部分的配置在配置文件的最下面:High availability cluster parameters 部分。 #主节点 Zabbix Server 配置 vim /etc/zabbix/zabbix_server.conf ...... DBHost=192.168.142.70 DBName=zabbix DBUser=zabbix DBPassword=zabbix ...... HANodeName=zbx-server01 #设置为当前节点主机名 NodeAddress=192.168.142.70:10051 #设置为节点IP systemctl restart zabbix-server #主节点给数据库授权远程登录权限 mysql -uroot -pabc123 GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix'; FLUSH PRIVILEGES; #备节点 Zabbix Server 配置 vim /etc/zabbix/zabbix_server.conf ...... DBHost=192.168.142.70 DBName=zabbix DBUser=zabbix DBPassword=zabbix ...... HANodeName=zbx-server02 NodeAddress=192.168.142.70:10051 systemctl restart zabbix-server #客户端配置 vim /etc/zabbix/zabbix_agentd.conf ...... Server=192.168.142.70,192.168.142.60 ServerActive=192.168.142.70;192.168.142.60 #注意,ServerActive 的连接符是‘;’ ,而不是‘,’ |
CopyRight 2018-2019 实验室设备网 版权所有 |