V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
miaosl
V2EX  ›  Linux

怎么 zabbix 这么费劲啊,我要气哭了

  •  
  •   miaosl · 2024-07-22 19:53:52 +08:00 · 5357 次点击
    这是一个创建于 376 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我真几把受不了了 这样的服务端: 乌班图 24 客户端 1: debian12 客户端 2: centos7 客户端一,客户端主机名:msl1 ,然后自动注册条件是包含 msl ,注册不上,然后用匹配,匹配 msl 就可以了卧槽了然后删了注册到的主机又试了一次包含又行了?!

    客户端二,离谱的事情来了, 客户端配置: [root@mha0 scripts]# grep -Ev '^#|^$' /etc/zabbix/zabbix_agentd.conf PidFile=/run/zabbix/zabbix_agentd.pid LogFile=/var/log/zabbix/zabbix_agentd.log LogFileSize=0 AllowKey=system.run[*] Server=10.33.0.1 ServerActive=10.33.0.1 HostnameItem=system.hostname AllowRoot=1 Include=/etc/zabbix/zabbix_agentd.d/*.conf 然后服务端日志疯狂的报: ` 57342:20240722:115112.559 cannot send list of active checks to "10.2.0.0": host [mha0] not found

    客户端疯狂的报: 40610:20240722:195037.476 no active checks on server [10.33.0.1:10051]: host [mha0] not found

    但是我明明都能在服务端: root@msl:~# zabbix_get -s 10.2.0.0 -k "system.run[hostname]" mha0

    ` 我快气哭了,有经验的大佬快来救救我

    35 条回复    2024-07-24 16:52:07 +08:00
    bronyakaka
        1
    bronyakaka  
       2024-07-22 20:26:10 +08:00
    只用过 prometheus grafana
    Int100
        2
    Int100  
       2024-07-22 20:26:41 +08:00
    只用过 prometheus grafana +1
    ClericPy
        3
    ClericPy  
       2024-07-22 20:34:12 +08:00
    最近两年有幸用过,实在是费劲。。。无奈下线了。你这报错问问大模型吧,说 mha0 没注册成功
    EKF/ELK + prometheus 配合云原生都成版本答案了
    daimaosix
        4
    daimaosix  
       2024-07-22 20:41:32 +08:00 via Android
    关键我也真几把受不了啊
    PolarBears
        5
    PolarBears  
       2024-07-22 21:19:15 +08:00
    zabbix 一开始我也用过一年,后来就都换 Prometheus 了
    Qetesh
        6
    Qetesh  
       2024-07-22 21:30:56 +08:00
    服务端上主机的主机名称不对
    CivAx
        7
    CivAx  
       2024-07-22 21:45:52 +08:00
    首先你为啥要用 zabbix… 你用的也都全是新的或者近代的系统,实在犯不上用 Zabbix
    R0n1n
        8
    R0n1n  
       2024-07-23 01:43:31 +08:00 via Android
    LibreNMS
    vuv
        9
    vuv  
       2024-07-23 02:05:21 +08:00
    我使用 debian 搭建过 zabbix ,用了下,不习惯,就没研究了。
    paxnil
        10
    paxnil  
       2024-07-23 08:41:35 +08:00
    日志和 zabbix_get 说明客户端主机名是 mha0 ,不是 msl1 ,服务端没有配置名为 mha0 主机。
    waringid
        11
    waringid  
       2024-07-23 09:10:21 +08:00
    应该是 zabbix 客户端获取的主机名称和你配置的主机名称不一致。先检查主机名是否一致,看看 /etc/hosts 里有没有对应的主机名称
    laminux29
        12
    laminux29  
       2024-07-23 09:13:13 +08:00
    zabbix 虽然用户体验一般,但也不至于这种最简单的部署都存在问题。

    如果是第一次部署 zabiix ,你其实可以让 gpt4 全程协助你部署,有问题就及时问 gpt4 。虽然 gpt4 有时候偶尔智障,但基本部署以及解决基本问题,还是可以的。
    offswitch
        13
    offswitch  
       2024-07-23 09:26:22 +08:00
    切换成 promethues ,现在都用 Prometheus 了,zabbix 以前比较流行,现在不怎么样。
    Hopetree
        14
    Hopetree  
       2024-07-23 09:50:28 +08:00
    zabbix 这种老掉牙的东西还有人用啊,promethues+grafana 搞起
    zyq2280539
        15
    zyq2280539  
       2024-07-23 10:19:50 +08:00
    我个人是用 zabbix,折腾久了也就有经验了,首先要在服务器端设置一个主机 host 标记,然后其他客户端都需要配置这个 host ,才可以。就一个配置问题
    zyq2280539
        16
    zyq2280539  
       2024-07-23 10:23:47 +08:00
    上面说的这个 hosts 是指/etc/zabbix/web/zabbix.conf.php 里面的$ZBX_SERVER_NAME ,这个是服务端的标记,所有客户端想要顺利链接都需要配置 hosts 为相同值而已,值就是一个字符串随便起名
    JontyChen
        17
    JontyChen  
       2024-07-23 10:26:05 +08:00
    上 prometheus 早日解脱
    frencis107
        18
    frencis107  
       2024-07-23 10:33:03 +08:00
    prometheus +1

    op 试试吧,非常好用
    McreeWu
        19
    McreeWu  
       2024-07-23 10:54:14 +08:00
    zabbix 配置起来真是麻烦,调试也麻烦,性能又一般,确实推荐 prometheus 。
    huangmingyou
        20
    huangmingyou  
       2024-07-23 11:11:24 +08:00
    为啥要用这个化石
    s270987763
        21
    s270987763  
       2024-07-23 11:55:19 +08:00
    1. 用了客户端主动上报模式;
    2. 日志报错 很明显是主机未能注册成功,无法发送主动上报的监控项;
    3. zabbix agent 配置 中主机名与 zabbix server web 配置中主机名不一致;
    4. 检查自动发现规则
    ladeo
        22
    ladeo  
       2024-07-23 13:32:19 +08:00
    zabbix 很好用啊。估计 op 不是运维人员。
    服务器<1000 台基本都 ok 。
    zabbix 都不好用的话,naggios 不是更不好用了吗?
    liuliancao
        23
    liuliancao  
       2024-07-23 14:40:44 +08:00
    第一个问题 有没可能是自动发现轮询间隔导致的 自动发现也可以设置 ip 段 要稍微等等
    第二个问题 客户端配置的 active 模式,你添加资产的时候 看下是不是选择了被动模式

    https://blog.51cto.com/qixue/category7.html 可以参考下我很久前写的 不过现在版本变化太大了 思路是差不多的

    不少 idc 都在使用,zabbix 还是挺好用的哈 使用这些肯定需要慢慢才会熟悉的 多折腾折腾 多 google 下

    如果还觉得受不了 也可以试用下 promethues 或者其他监控软件
    8355
        24
    8355  
       2024-07-23 15:03:55 +08:00
    zabbix 那复杂的界面 不会用上手极为费劲
    prometheus + grafana
    拥抱现代化吧。。
    Sharuru
        25
    Sharuru  
       2024-07-23 15:21:08 +08:00
    借楼求问 prometheus 有没有开箱即用的报警规则?
    miaosl
        26
    miaosl  
    OP
       2024-07-23 16:06:37 +08:00
    @Qetesh 啊,大哥,我发现自动注册不设置条件就可以了,但是为啥设置条件就不行了,难道这个条件是对已经获取了的主机进行赛选用的嘛
    miaosl
        27
    miaosl  
    OP
       2024-07-23 16:09:06 +08:00
    @paxnil 可能没说清楚,客户端 2 是 mha0 客户端 1 是 msl1 ,这个没问题的,我发现是因为我添加了自动注册条件导致的,但是讲道理这个自动注册条件为啥会报错
    miaosl
        28
    miaosl  
    OP
       2024-07-23 16:11:12 +08:00
    @s270987763 是自动注册,我昨天看了一下,自动注册的条件是非必填项目,但是我填了,
    不填条件的化都能自动注册的,但是这个自动注册的条件到底是怎么用的
    miaosl
        29
    miaosl  
    OP
       2024-07-23 16:11:47 +08:00
    @Sharuru 我看好多人都在说普罗米修斯才是主流,我的研究一下了
    FlytoSirius
        30
    FlytoSirius  
       2024-07-23 16:35:22 +08:00
    很多年前,Zabbix 和 Nagios 还很流行, 云计算也并不普遍, 当时部署使用 Zabbix 管理我们的单位的数据中心。
    这么多年过去了, 现在做决策说还要用 Zabbix 的, 可能也都算是老头子了吧 。。。
    yulgang
        31
    yulgang  
       2024-07-23 16:36:47 +08:00
    我没遇到过这种问题。

    agent 配置文件里的 hostname 要配置对,和 server 端网页里对应这个主机的 Host name 要一致,我习惯添 agent 端的 IP 地址。
    自动注册时 agent 配置文件里的 HostMetadata 也要设置对,然后 server 端网页上的自动注册的 Conditions 里配置 Host metadata contains XXXX ,Operations 里可以:

    Add to host groups: YYYY ;
    Remove from host groups: Discovered hosts ;
    Link to templates: TTTT

    这样就把 HostMetadata 里包含 XXXX 的主机自动添加到 YYYY 组里,如然后从自动注册分组里删掉这个主机,关联监控模板 TTTT


    host [mha0] not found 猜测是你的 agent 端 hosts 里没配置这个主机名的记录
    unknown404
        32
    unknown404  
       2024-07-23 16:46:39 +08:00
    miaosl
        33
    miaosl  
    OP
       2024-07-23 16:49:53 +08:00
    @yulgang 大哥,我最后是把 server 端的自动注册的条件取消了之后就可以了,因为我最开始学的时候,好像那个自动注册条件是就不需要配置?
    还是说这个自动注册的条件是对已经注册成主机的经行赛选分类的?
    263
        34
    263  
       2024-07-24 14:44:54 +08:00
    看你的参数,只有 HostnameItem ,没有 Hostname ,这是不正确的配置。
    zabbix 建议即使设置了 HostnameItem=system.hostname ,也需要是指正确的 Hostname= mha0 。HostnameItem=system.hostname 是用来指定获取 hostname 的方法,而不是设置 hostname 。
    agent 的部署推荐使用 ansible 等来批量部署,直接获取系统变量填写,不要使用 HostnameItem=system.hostname 这种方式
    liuliancao
        35
    liuliancao  
       2024-07-24 16:52:07 +08:00
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2090 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 78ms · UTC 00:30 · PVG 08:30 · LAX 17:30 · JFK 20:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.