首页 星云 工具 资源 星选 资讯 热门工具
:

PDF转图片 完全免费 小红书视频下载 无水印 抖音视频下载 无水印 数字星空

2024 年了,IT 运维监控系统都有哪些推荐?

编程知识
2024年08月12日 13:58

大浪淘沙,2024 年的今天,市面上很多监控系统慢慢淡出了大家的视野,而一些新的监控系统也逐渐崭露头角。今天我们就来看看 2024 年的当下,哪些 IT 运维监控系统最值得关注。

Prometheus

Prometheus-architecture

毫无疑问,Prometheus 是最值得关注的监控系统,因为 Prometheus 的规范和生态都非常厉害,很多中间件、数据库,直接就内置支持了 Prometheus,比如 ETCD、Kubernetes、RabbitMQ、Nginx VTS 等等,这个势能是非常强大的。

尤其是在容器和微服务监控场景,Prometheus 生态是不二之选,因为:

  • 由于资源的生命周期比较短,通常是基于服务发现来发现监控目标,而不是资产管理式(Zabbix就是资产管理式)。
  • 多维度筛选的需求强烈,比如通过标签聚合、过滤、分组等。需要一个针对性的 Query Language。PromQL 就是为此而生。

当然,这里我们说的是 Prometheus 生态,至于是否真的使用 Prometheus 二进制倒不一定,因为 Prometheus 本身的存储和查询性能并不是很好,所以很多公司会选择使用 Prometheus 的兼容产品,比如 VictoriaMetrics、Thanos 等。

Grafana

Prometheus 可以搞定数据采集、存储问题,并提供查询接口、查询语言,但是对于数据的展示,Prometheus 本身并不是很强大,通常大家会选择使用 Grafana 作为展示工具。

Grafana 不仅仅为 Prometheus 提供了很多的 Dashboard 模板,而且还支持多种数据源,比如 InfluxDB、Elasticsearch、Loki、MySQL、PostgreSQL、CloudWatch、Zabbix 等等。Grafana 的可视化能力,基本就是开源领域的标杆甚至事实标准了。

Grafana Dashboard

Nightingale

Nightingale

很多公司有多套 Prometheus,我在社区里见过一个公司有 200 多套 Prometheus,四五套、八九套的更是比比皆是,此时,大家就很想统一管理,比如公司有 8 套 Kubernetes,每套 Kubernetes 都有一个 Prometheus,这些 Prometheus 的数据类似,告警规则通用,每次修改一个告警规则,要修改 8 套 Prometheus,这就很麻烦了。另外,监控能力作为基础能力,通常是开放给公司所有业务研发团队,需要一些权限管控、知识沉淀的能力,Nightingale 可以帮助你解决这些问题。

Nightingale 的核心是做一个告警引擎,支持对接 Prometheus、VictoriaMetrics、Thanos、M3DB、Loki 等多种数据源,统一管理告警规则。而且考虑了边缘机房网络割裂的场景,即便是边缘机房和中心机房之间的网络坏掉了,边缘机房内部也可以自闭环生成、发送告警。

Zabbix

Zabbix

Zabbix 相对比较老了,擅长服务器、网络设备的监控,不擅长 Kubernetes、微服务的监控,由于越来越多的公司采用公有云,公有云自然搞定了硬件、网络设备的监控,所以 Zabbix 的市场份额在逐渐下降。

国内很多公司在使用 Zabbix,社区较为活跃,很多公司基于 Zabbix 封装了商业化产品,如果你是网工或系统运维,Zabbix 还是值得关注的。

其他

当然,还有一些其他的监控系统,比如:Cacti、Nagios,都太老了,不推荐使用。Cacti 在网工圈子里还是有一定的市场份额,Nagios 基本销声匿迹了。

监控作为稳定性保障的重要手段,涉及到的内容非常驳杂,如果您找乙方协助构建监控、可观测性方案,欢迎联系我们做产品技术交流:https://flashcat.cloud/contact/

From:https://www.cnblogs.com/ulricqin/p/18354967
本文地址: http://shuzixingkong.net/article/1022
0评论
提交 加载更多评论
其他文章 wpf 如何7步写一个badge控件
首先看一下效果: 任意控件可以附加一个文字在控件的右上角,并带有红色背景 第一步,新建一个空的wpf项目: 第二步,创建一个类,取名为badge: 第三步,将badge的父类设置成 System.Windows.Documents.Adorner public class Badge : Adorn
wpf 如何7步写一个badge控件
为了给Javaer落地DDD,我们不得不写开源组件
本文上回书接《这是DDD建模最难的部分(其实很简单)》,欢迎关注我的同名公众号,获取框架源码。 https://mp.weixin.qq.com/s/HZKMLF0_I10iczzp2mAR-w 故事背景 2013年中,我们的Java后端团队为了落地DDD,全面引入了dotnet技术栈,具体过程和成
为了给Javaer落地DDD,我们不得不写开源组件 为了给Javaer落地DDD,我们不得不写开源组件
后端开发学习敏捷需求-->干系人分析与识别
干系人分析与识别 5W1H 干系人分析与识别 1. 干系人是什么 直接或者间接影响专题,以及被专题影响的人和组织,用户也是属于干系人,是产品直接或者间接的使用者 又叫利益相关者,指积极参与专题或者在专题中其利益可能受积极或消极影响的个人或组织 2. 为什么要分析和识别干系人 找出对专题或者产品有重要
后端开发学习敏捷需求-->干系人分析与识别
结构开发笔记(三):solidworks软件(二):小试牛刀,绘制一个立方体
前言 solidworks草图大师,基本的使用过程。 所有的零件基础都是从平面绘制开始,然后凸出来厚度。 本篇绘制一个简单的立方体,熟悉基本操作。 立方体绘制过程 选取一个平面绘制一个立方形,然后拉伸即可。 绘制矩形的方式: 功能所见即所得。 其实用2021版本,还会有动画的提示。(开始以为点进去有
结构开发笔记(三):solidworks软件(二):小试牛刀,绘制一个立方体 结构开发笔记(三):solidworks软件(二):小试牛刀,绘制一个立方体 结构开发笔记(三):solidworks软件(二):小试牛刀,绘制一个立方体
零基础学习人工智能—Python—Pytorch学习(四)
前言 接续上一篇的optimizer的学习。 optimizer 代码和上一篇文章的一样,如下: import torch import numpy as np import torch.nn as nn X = torch.tensor([1, 2, 3, 4], dtype=torch.floa
零基础学习人工智能—Python—Pytorch学习(四)
java 栈与队列
Java中的栈与队列 一、栈(Stack) 1.1 介绍 栈是一种后进先出(LIFO,Last In First Out)的数据结构。在栈中,元素的插入和删除操作都是在栈顶进行的。Java中的java.util.Stack类实现了栈的基本功能,包括push()入栈、pop()出栈、peek()查看栈
《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘
《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限
《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘 《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘 《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘
手把手教你实现Scrapy-Redis分布式爬虫:从配置到最终运行的实战指南
本文详细讲解了如何通过Scrapy-Redis实现分布式爬虫的全过程,涵盖配置步骤、代码实现以及最终运行的效果展示。通过实战操作,帮助读者快速掌握Scrapy-Redis在分布式爬虫中的应用技巧。
手把手教你实现Scrapy-Redis分布式爬虫:从配置到最终运行的实战指南 手把手教你实现Scrapy-Redis分布式爬虫:从配置到最终运行的实战指南