可靠的IT智能化运维监控产品

时间:2023年05月11日 来源:

在云原生时代,基础设施与应用的部署构建都发生了极大变化,传统的监控方式已经无法适应云原生的场景。Prometheus支持对kubernetes和容器的监控,基本上是完美选择,那么通过Prometheus监控体系如何搭建PAAS监控体系?监控哪些对象?

k8s管理组件、节点、pod容器、各种中间件数据库组件指标:mysql、redis、kafka、rocketmq、activemq、zookeeper、elasticsearch、mongodb、nginx、clickhouse。同时,还提供了kingbase、polardb、GreatDB等国产数据库的监控。

怎么监控?

k8s组件监控:Prometheus直接拉取各组件的metrics接口数据;

节点监控:在各节点部署node_exporter,Prometheus自动发现所有节点对象拉取exporter提供的数据;

pod容器监控:用各节点部署的kubelet的cadivisor功能,使Prometheus自动发现并拉取cadivisor提供的容器运行时指标,并部署kube-state-metrics拉取pod容器元数据。 Argus运维监控全自动拓扑生成,准确率高达90%以上。可靠的IT智能化运维监控产品

Zabbix 是 B/S 架构,抓取数据是通过客户端抓取的,在客户端必须有服务启动,该服务负责采集数据,数据会主动上报给服务端,也可让服务端连接客户端去抓取数据。客户端分为两种模式,即主动模式和被动模式。Argus运维监平台以 Zabbix 为基础,可同时兼容 不同版本的Zabbix,以 zabbix 为采集关键配合自研的 ArgusNMS 增强模块为一组采集单元, ArgusEdge 的统一调度实现监管控的需求。单一业务环境下可以支持多 组采集单元(多zabbix-server),实现真正意义上的分布式采集。 运维监控平台排行榜以 zabbix 为采集中心配合自研的 ArgusNMS 增强模块为一组采集单元, ArgusEdge 的统一调度实现监管控的需求。

对于网络出口与网络专线的有效监控与分析,既能协助业务运维同学有效地定位业务异常、评估业务服务质量等,也能有效地度量业务整体运营成本,毕竟现在带宽的使用成本在整体运营成本中也是占比越来越大。相信运维同学多少都会遇到下面等较高频的使用场景:

这条专线当前利用率多少?

在已经使用的流量中,某个IP使用了多少流量?这些所产生的流量是基于什么协议与方向?

专线与网络出口的丢包率与时延是怎么样的?

每条专线中主要是哪些务在用?哪个是“地主客户”?对

于网络流量的监控来说,其实中心是一个分析平台,通过把采集到的各种流量包抓取过来,然后再把相应的流量送入分析集群。

Argus运维监控中硬件监控包括:可以通过IPMI对硬件详细情况进行监控,并对CPU、内存、磁盘、温度、风扇、电压等设置报警设置报警阈值(自行对监控报警内容编写合理的报警范围)IPMI工具无法获取到硬件的状态,可以借助MegaCli工具探测Raid磁盘队列状态zabbix提供IPMI监控模板:ZabbixIPMIInterface。同时也能够实时采集到服务器的硬件报错日志,代替管理员的日常机房巡检工作,使管理员实时了解到服务器底层硬件的运行情况。带外方式不通过操作系统,即使系统关机的状态下仍可监控服务器的基本硬件健康状况 想吃透运维监控系统,就这一篇足够了!

对于网络设备的监控,也一般从设备性能、质量、状态等维度入手。对于每台网络设备来说运维同学一般会关注如下等高频场景:

网络设备的运行状态syslog(设备运行日志)的监控与告警;设备堆叠状态下的(例如交换机堆叠)的监控与告警;网络设备上每个物理端口的、流量、包量、错包与端口状态的监控与告警;网络设备上逻辑端口(物理端口组合)的性能与状态。

对于网络设备的syslog告警来说,同样也会面临诸如:不同的厂商、设备类型与设备型号日志标准不统一等问题。

所以对于网络设备syslog监控告警来说,首先是将众多的网络设备进行逻辑分组,以便于在一个分组内的设备均可以响应同一个告警关键字,并且这个分组粒度建议较细,这样才能保障告警关键字的有效性与独一性。在这里根据多年的运维经验,建议syslog告警的分组模型由四个维度组成:厂商+类型+型号+用途例如:CISCO+交换机+EX43000-24T+内网接入层交换机,通过这个公式就描述出一个设备的逻辑分组。 Argus运维监控事件聚合的同时, 保留了每一条事件的详情, 以便深入分析。系统智能化运维监控管理平台

Argus运维监控系统从展现、指标模型构建、数据采集等维度对Zabbix进行增强。可靠的IT智能化运维监控产品

Argus运维监控系统基于ZABBIX的预处理及自动发现功能,有效整合PROMETHEUS。

环境复杂 :在现有的架构环境中,既有虚拟主机,又有 Kubernets 集群 

监控工具多 : 在现有的环境中的监控工具既有zabbix,又有 prometheus § Zabbix的监控项及Prometheus的配置仍为大量的 手工操作 § 每套工具有单独的技术栈,维护成本高 

无统一化告警人管理 :zabbix及grafana中都有告警人配置

数据采集 : Prometheus 负责Exporter及 Kubernets集群的 监控项采集,并单独于Kubernets集群外部署 § Zabbix负责虚拟主机监控项的采集 

事件处理 : Zabbix 通过HTTP agent 方式查询不同的 prometheus 采集节点,并通过监控项模板中监控项 的预处理及自动发现功能自动创建不同应用名称的监 控项及监控项阈值 § Zabbix 通过不同监控项的当前数据判断阈值并触 发不同阈值级别下相应的动作 § 各阈值动作通过应用名关联不同的用户组,触发 钉钉通知到对应的研发团队 可靠的IT智能化运维监控产品

上海观纵科技有限公司主营品牌有webfunny,walkingfunny,argus,发展规模团队不断壮大,该公司服务型的公司。观纵科技是一家有限责任公司企业,一直“以人为本,服务于社会”的经营理念;“诚守信誉,持续发展”的质量方针。公司拥有专业的技术团队,具有webfunny前端监控,webfunny前端埋点,全链路应用性能监控,Argus-IT运维监控等多项业务。观纵科技自成立以来,一直坚持走正规化、专业化路线,得到了广大客户及社会各界的普遍认可与大力支持。

信息来源于互联网 本站不为信息真实性负责