我真几把受不了了 这样的服务端: 乌班图 24 客户端 1: debian12 客户端 2: centos7 客户端一,客户端主机名:msl1 ,然后自动注册条件是包含 msl ,注册不上,然后用匹配,匹配 msl 就可以了卧槽了然后删了注册到的主机又试了一次包含又行了?!
客户端二,离谱的事情来了,
客户端配置:
[root@mha0 scripts]# grep -Ev '^#|^$' /etc/zabbix/zabbix_agentd.conf PidFile=/run/zabbix/zabbix_agentd.pid LogFile=/var/log/zabbix/zabbix_agentd.log LogFileSize=0 AllowKey=system.run[*] Server=10.33.0.1 ServerActive=10.33.0.1 HostnameItem=system.hostname AllowRoot=1 Include=/etc/zabbix/zabbix_agentd.d/*.conf
然后服务端日志疯狂的报:
`
57342:20240722:115112.559 cannot send list of active checks to "10.2.0.0": host [mha0] not found
客户端疯狂的报:
40610:20240722:195037.476 no active checks on server [10.33.0.1:10051]: host [mha0] not found
但是我明明都能在服务端:
root@msl:~# zabbix_get -s 10.2.0.0 -k "system.run[hostname]"
mha0
` 我快气哭了,有经验的大佬快来救救我
![]() |
1
bronyakaka 2024-07-22 20:26:10 +08:00
只用过 prometheus grafana
|
![]() |
2
Int100 2024-07-22 20:26:41 +08:00
只用过 prometheus grafana +1
|
![]() |
3
ClericPy 2024-07-22 20:34:12 +08:00
最近两年有幸用过,实在是费劲。。。无奈下线了。你这报错问问大模型吧,说 mha0 没注册成功
EKF/ELK + prometheus 配合云原生都成版本答案了 |
![]() |
4
daimaosix 2024-07-22 20:41:32 +08:00 via Android
关键我也真几把受不了啊
|
![]() |
5
PolarBears 2024-07-22 21:19:15 +08:00
zabbix 一开始我也用过一年,后来就都换 Prometheus 了
|
![]() |
6
Qetesh 2024-07-22 21:30:56 +08:00
服务端上主机的主机名称不对
|
![]() |
7
CivAx 2024-07-22 21:45:52 +08:00
首先你为啥要用 zabbix… 你用的也都全是新的或者近代的系统,实在犯不上用 Zabbix
|
8
R0n1n 2024-07-23 01:43:31 +08:00 via Android
LibreNMS
|
![]() |
9
vuv 2024-07-23 02:05:21 +08:00
我使用 debian 搭建过 zabbix ,用了下,不习惯,就没研究了。
|
![]() |
10
paxnil 2024-07-23 08:41:35 +08:00
日志和 zabbix_get 说明客户端主机名是 mha0 ,不是 msl1 ,服务端没有配置名为 mha0 主机。
|
![]() |
11
waringid 2024-07-23 09:10:21 +08:00
应该是 zabbix 客户端获取的主机名称和你配置的主机名称不一致。先检查主机名是否一致,看看 /etc/hosts 里有没有对应的主机名称
|
12
laminux29 2024-07-23 09:13:13 +08:00
zabbix 虽然用户体验一般,但也不至于这种最简单的部署都存在问题。
如果是第一次部署 zabiix ,你其实可以让 gpt4 全程协助你部署,有问题就及时问 gpt4 。虽然 gpt4 有时候偶尔智障,但基本部署以及解决基本问题,还是可以的。 |
![]() |
13
offswitch 2024-07-23 09:26:22 +08:00
切换成 promethues ,现在都用 Prometheus 了,zabbix 以前比较流行,现在不怎么样。
|
![]() |
14
Hopetree 2024-07-23 09:50:28 +08:00
zabbix 这种老掉牙的东西还有人用啊,promethues+grafana 搞起
|
![]() |
15
zyq2280539 2024-07-23 10:19:50 +08:00
我个人是用 zabbix,折腾久了也就有经验了,首先要在服务器端设置一个主机 host 标记,然后其他客户端都需要配置这个 host ,才可以。就一个配置问题
|
![]() |
16
zyq2280539 2024-07-23 10:23:47 +08:00
上面说的这个 hosts 是指/etc/zabbix/web/zabbix.conf.php 里面的$ZBX_SERVER_NAME ,这个是服务端的标记,所有客户端想要顺利链接都需要配置 hosts 为相同值而已,值就是一个字符串随便起名
|
17
JontyChen 2024-07-23 10:26:05 +08:00
上 prometheus 早日解脱
|
![]() |
18
frencis107 2024-07-23 10:33:03 +08:00
prometheus +1
op 试试吧,非常好用 |
![]() |
19
McreeWu 2024-07-23 10:54:14 +08:00
zabbix 配置起来真是麻烦,调试也麻烦,性能又一般,确实推荐 prometheus 。
|
![]() |
20
huangmingyou 2024-07-23 11:11:24 +08:00
为啥要用这个化石
|
21
s270987763 2024-07-23 11:55:19 +08:00
1. 用了客户端主动上报模式;
2. 日志报错 很明显是主机未能注册成功,无法发送主动上报的监控项; 3. zabbix agent 配置 中主机名与 zabbix server web 配置中主机名不一致; 4. 检查自动发现规则 |
![]() |
22
ladeo 2024-07-23 13:32:19 +08:00
zabbix 很好用啊。估计 op 不是运维人员。
服务器<1000 台基本都 ok 。 zabbix 都不好用的话,naggios 不是更不好用了吗? |
![]() |
23
liuliancao 2024-07-23 14:40:44 +08:00
第一个问题 有没可能是自动发现轮询间隔导致的 自动发现也可以设置 ip 段 要稍微等等
第二个问题 客户端配置的 active 模式,你添加资产的时候 看下是不是选择了被动模式 https://blog.51cto.com/qixue/category7.html 可以参考下我很久前写的 不过现在版本变化太大了 思路是差不多的 不少 idc 都在使用,zabbix 还是挺好用的哈 使用这些肯定需要慢慢才会熟悉的 多折腾折腾 多 google 下 如果还觉得受不了 也可以试用下 promethues 或者其他监控软件 |
![]() |
24
8355 2024-07-23 15:03:55 +08:00
zabbix 那复杂的界面 不会用上手极为费劲
prometheus + grafana 拥抱现代化吧。。 |
25
Sharuru 2024-07-23 15:21:08 +08:00
借楼求问 prometheus 有没有开箱即用的报警规则?
|
26
miaosl OP @Qetesh 啊,大哥,我发现自动注册不设置条件就可以了,但是为啥设置条件就不行了,难道这个条件是对已经获取了的主机进行赛选用的嘛
|
27
miaosl OP @paxnil 可能没说清楚,客户端 2 是 mha0 客户端 1 是 msl1 ,这个没问题的,我发现是因为我添加了自动注册条件导致的,但是讲道理这个自动注册条件为啥会报错
|
28
miaosl OP @s270987763 是自动注册,我昨天看了一下,自动注册的条件是非必填项目,但是我填了,
不填条件的化都能自动注册的,但是这个自动注册的条件到底是怎么用的 |
![]() |
30
FlytoSirius 2024-07-23 16:35:22 +08:00
很多年前,Zabbix 和 Nagios 还很流行, 云计算也并不普遍, 当时部署使用 Zabbix 管理我们的单位的数据中心。
这么多年过去了, 现在做决策说还要用 Zabbix 的, 可能也都算是老头子了吧 。。。 |
![]() |
31
yulgang 2024-07-23 16:36:47 +08:00
我没遇到过这种问题。
agent 配置文件里的 hostname 要配置对,和 server 端网页里对应这个主机的 Host name 要一致,我习惯添 agent 端的 IP 地址。 自动注册时 agent 配置文件里的 HostMetadata 也要设置对,然后 server 端网页上的自动注册的 Conditions 里配置 Host metadata contains XXXX ,Operations 里可以: Add to host groups: YYYY ; Remove from host groups: Discovered hosts ; Link to templates: TTTT 这样就把 HostMetadata 里包含 XXXX 的主机自动添加到 YYYY 组里,如然后从自动注册分组里删掉这个主机,关联监控模板 TTTT host [mha0] not found 猜测是你的 agent 端 hosts 里没配置这个主机名的记录 |
32
unknown404 2024-07-23 16:46:39 +08:00
|
33
miaosl OP @yulgang 大哥,我最后是把 server 端的自动注册的条件取消了之后就可以了,因为我最开始学的时候,好像那个自动注册条件是就不需要配置?
还是说这个自动注册的条件是对已经注册成主机的经行赛选分类的? |
34
263 2024-07-24 14:44:54 +08:00
看你的参数,只有 HostnameItem ,没有 Hostname ,这是不正确的配置。
zabbix 建议即使设置了 HostnameItem=system.hostname ,也需要是指正确的 Hostname= mha0 。HostnameItem=system.hostname 是用来指定获取 hostname 的方法,而不是设置 hostname 。 agent 的部署推荐使用 ansible 等来批量部署,直接获取系统变量填写,不要使用 HostnameItem=system.hostname 这种方式 |
![]() |
35
liuliancao 2024-07-24 16:52:07 +08:00
|