比如一个教务系统,在全国多地的高校进行了部署,每个教务系统可以通过统一的一个管理地址进行一些后台的管理操作。
我要监控这些教务系统的运行异常情况,两个维度:日志和资源维度 比如某个学校批量选课的时候系统崩了,期望能通过比如某一段时间内错误日志出现了多少次,或者 CPU 或者内存连续几分钟内被拉满,能做到一个接近实时的感知,然后运维通过后台连接上去及时进行处理
以前用过阿里的 xflush ( Sunfire ),说实话挺好用的,可以设定监控的规则,报警的形式,CPU 内存的阈值,够了,想咨询下有没有对标 Sunfire 的开源日志监控系统
![]() |
1
rrfeng 6 天前
没听过 sunfire ,开源的试试 loki+grafana ?
|