首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【运维自动化-节点管理】节点管理采集插件扩展维护指引

【运维自动化-节点管理】节点管理采集插件扩展维护指引

原创
作者头像
腾讯蓝鲸助手
发布2026-04-15 15:05:17
发布2026-04-15 15:05:17
140
举报

在如何安装插件的指引中,我们知道插件是由gse_agent托管的,那要维护时具体怎么做呢?

1、插件程序位置

插件安装在gse agent的同级路径

代码语言:js
复制
/usr/local/gse_bkte/agent   #
gse agent部署目录/usr/local/gse_bkte/plugins #插件部署目录

2、插件配置文件

插件的配置文件,在plugins目录下的etc目录下,插件配置文件以“插件名称.conf"命名。

代码语言:js
复制
[root@VM-42-61-centos /usr/local/gse_bkte/plugins/etc]# ll
total 
36-rw-r--r-- 1 root root 1944 Mar 11 10:17 basereport.confd--xr--r-- 2 root root 4096 Jul  6 19:34 bkmonitorbeat
-rwxr-xr-x 1 root root 8231 Jul  6 19:34 bkmonitorbeat.conf
-rw-r--r-- 1 root root  638 Mar 11 10:17 bkunifylogbeat.conf
-rw-r--r-- 1 root root  405 Mar 11 10:17 exceptionbeat.conf
-rw-r--r-- 1 root root   72 Mar 11 10:17 gsecmdline.conf
-rw-r--r-- 1 root root  585 Mar 11 10:17 processbeat.conf

3、插件如何进行启动、停止、重启或者重载

A、通过节点管理进行插件(插件)的启动、停止或重启 (推荐)

在这里插入图片描述
在这里插入图片描述

B、在服务器上进行修改 (不推荐)

在plugins的bin目录下,有reload.sh、restart.sh、start.sh、stop.sh,进行对应操作。

代码语言:js
复制
./restart.sh bkmonitorbeat  # 重启蓝鲸监控指标插件
./reload.sh bkmonitorbeat   # 重载蓝鲸监控指标插件 

# 因为gse agent的托管了插件,所以即使在机器上启动、停止进程,agent均会按照托管配置进行对应操作。
# 例如:stop掉了插件,agent又会拉起插件,即stop无法达到预期目的。
# 所以,插件的启动和停止,建议在 ”A、节点管理“上操作。

./start.sh bkmonitorbeat    # 启动蓝鲸监控指标插件
./stop.sh bkmonitorbeat     # 停止蓝鲸监控指标插件

4、插件擦程序日志查看

插件的日志是写入到/var/log/gse_bkte目录下的。

5、插件启停日志查看

插件的启停脚本中,会往/tmp/bkc.log写入日志,记录启停信息。

代码语言:js
复制
# tail /tmp/bkc.log20220623-141557 INFO|83|log-main stop bkmonitorbeat ...20220623-141559 INFO|75|log-main start bkmonitorbeat ...20220706-193451 INFO|96|log-main stop bkmonitorbeat ...20220706-193453 INFO|185|log-main start bkmonitorbeat ...20220706-203857 INFO|185|log-main start bkmonitorbeat ...20220706-203908 INFO|185|log-main start bkmonitorbeat ...20220706-205212 INFO|96|log-main stop bkunifylogbeat ...20220706-205214 INFO|185|log-main start bkunifylogbeat ...

6、如何限制监控采集插件的资源使用率

节点管理的资源配额功能如何使用中,我们知道了为了保证宿主机的稳定,可以对插件的资源使用进行限制。

  • 采集插件本身的配置文件,如:/usr/local/gse_bkte/plugins/etc/bkmonitorbeat.confresource_limit: enabled: true cpu: 1 # CPU 资源限制 单位 core(float64) mem: -1 # 内存资源限制 单位 MB(int),-1 代表无限制cpu:1 # 表示限制为1核使用。(该使用率是在多核上进行动态漂移的使用率,非物理上的单核cpu使用率) mem:-1 # 内存限制请勿自行修改,在某些linux内核版本上,可能会引发bug,使得采集器崩溃
  • 如何查看采集插件的资源使用率 在gse agent的etc目录(/usr/local/gse_bkte/agent/etc)下,可以看到proinfo.json配置文件。
代码语言:js
复制
{
		 "procName" : "bkmonitorbeat",
         "cpulmt" : 10,
         "memlmt" : 10,
		 ......
 }

cpulmt:该插件的cpu最高资源使用率。默认10,表示该插件运行最高占用主机的10%的cpu资源时,gse agent会kill掉该采集器。

memlmt:该插件的内存最高最高资源使用率。默认10,表示该插件运行最高占用主机的10%的内存资源,gse agent会kill掉该采集器。

Ps:因为gse agent对托管文件proinfo.json的保护机制,当采集器重启后,对应的采集器托管配置会重置为默认值,所以手动修改服务器配置文件只是临时方案,长效方案建议在节点管理进行配置。

说明:适合产品版本 V6.1/V6.2/V7.0/V7.1

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、插件程序位置
  • 2、插件配置文件
  • 3、插件如何进行启动、停止、重启或者重载
  • 4、插件擦程序日志查看
  • 5、插件启停日志查看
  • 6、如何限制监控采集插件的资源使用率
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档