首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏hfl的运维笔记

    TKE节点管理

    节点生命周期 在集群的控制面板上查看 状态 有健康,异常,已封锁,驱逐中 [集群面板] 新增节点 一个明显的蓝色按钮,新增节点,也可以灵活选择配置,数量 [新增节点] 查看初始化进度 [初始化] kubectl 29h v1.16.3-tke.9 172.27.16.7 Ready master 30h v1.16.3-tke.9 移除节点 移除节点会有提示 [移除节点] 如果是workload的pod在节点移除了,pod会在新的的节点新建;如果是裸pod,是会删除的,不会新建 驱逐或封锁节点 封锁节点,不调度节点 [封锁节点] 集群里查看状态 v1.16.3-tke.9 172.27.16.7 Ready master 30h v1.16.3-tke.9 极端情况,创建pod没有node节点可以调度时 取消封锁 [取消封锁] 驱逐 删除节点上的pod后,节点不可调度 [驱逐] 查看状态,驱逐中,节点上的pod在其他的节点创建 [ 查看状态] 完成节点维护后,可以取消封锁

    1.8K00发布于 2020-06-29
  • 来自专栏开源部署

    Kubernetes节点与令牌管理

    一、令牌管理 查看令牌 [root@master ~]# kubeadm token list 删除令牌 [root@master ~]# kubeadm token delete <令牌值> 创建令牌 二、K8S节点管理 2.1、查看节点 查看当前的节点信息: [root@master ~]# kubectl get nodes NAME STATUS ROLES AGE 会忽略那些不能杀死的系统类型的 pod 参数说明: --force:当一些pod不是经 ReplicationController, ReplicaSet, Job, DaemonSet 或者 StatefulSet 管理的时候 就需要用 --force 来强制执行 (例如:kube-proxy)   --ignore-daemonsets:无视 DaemonSet 管理下的 Pod   --delete-local-data 然后,通过对物理机断电或者在云平台上删除节点所在的虚拟机,都能安全的将节点移除。

    1.2K10编辑于 2022-09-15
  • 【运维自动化-节点管理节点管理采集插件扩展维护指引

    :17 gsecmdline.conf-rw-r--r-- 1 root root 585 Mar 11 10:17 processbeat.conf3、插件如何进行启动、停止、重启或者重载A、通过节点管理进行插件 # 所以,插件的启动和停止,建议在 ”A、节点管理“上操作。./start.sh bkmonitorbeat # 启动蓝鲸监控指标插件. stop bkunifylogbeat ...20220706-205214 INFO|185|log-main start bkunifylogbeat ...6、如何限制监控采集插件的资源使用率在 节点管理的资源配额功能如何使用中 Ps:因为gse agent对托管文件proinfo.json的保护机制,当采集器重启后,对应的采集器托管配置会重置为默认值,所以手动修改服务器配置文件只是临时方案,长效方案建议在节点管理进行配置。

    1600编辑于 2026-04-15
  • 【运维自动化-节点管理节点管理跟配置平台的联动关系

    节点管理和配置平台都纳管了主机资源,那两者的联动关系和区别是啥呢共通点两者都纳管了平台全部的主机资源云区域信息两者是共通的差异点配置平台是业务拓扑、主机、进程等资源对象的管理入口节点管理只是单向同步配置平台的配置信息 (除云区域可以创建反写配置平台之外)联动关系1、新增机器新增机器到蓝鲸平台可以通过配置管理导入也可以通过节点管理安装注册到配置平台。 成功导入之后,大概1-2分钟会同步到节点管理侧,然后可以进行安装agent操作图片b)节点管理安装注册,可以安装直连区域和非直连区域的机器,安装完agent之后,会自动把主机注册到配置平台所选业务的空闲机模块下 2、销毁机器当确认机器不再使用,需要下架处理,则操作步骤为:a)节点管理卸载agent,根据前面提到的差异的点2,节点管理不能把机器删除掉,只能对agent进行操作。

    12810编辑于 2026-02-03
  • 【运维自动化-节点管理节点管理有哪些插件?如何安装插件?

    节点管理里的插件指的是gse插件,是由gse_agent托管的具有一定特定功能的程序。目前提供的插件主要是监控平台/日志平台采集器使用。插件有哪些? Ps:需要注意的是,6.1版本插件虽然进行了合并,但是老的几个插件并没有直接下掉,因为需要兼容旧版本,所以如果部署的是6.1版本或者升级到了6.1版本,可以在节点管理取消托管并停掉basereport、 同时在节点管理后台配置默认不再自动安装以上三个插件。 3、节点管理手动更新安装如果没有配置插件更新策略,可以手动到节点管理更新插件版本说明:适合产品版本 V6.1/V6.2/V7.0/V7.1

    12710编辑于 2026-04-01
  • 来自专栏院长运维开发

    在CEPH管理节点创建pool

    创建一个池名为:wopool 的池,大小为:66 [root@node1 ~]# ceph osd pool create wopool 66 pool 'wopool' created

    1.3K20发布于 2020-06-13
  • 来自专栏区块链PLUS

    区块链节点的密钥管理

    有些节点使用密文的方式存储私钥,但加密所用的密钥缺乏较好的保护措施,容易被盗取,导致私钥的泄露。 1、概述         本文主要讨论一种区块链节点的密钥管理方案。 区块链节点都会有各自的私钥,将一段随机数分成两段,一段存在配置文件,一段写在节点的运行代码里,通过某种算法结合这两段随机数,生成一个对称密钥,用这个对称秘钥对私钥加密,将加密后的私钥存储在配置文件中。 2.现有技术方案        现有技术对区块链节点私钥或密钥的管理办法在安全性方面有较大缺陷,本文提出的对密钥的管理方法,可以很大程度地提高私钥的安全性,(1)私钥通过对称密钥加密保存,杜绝明文存储带来的泄露风险 ,用对应节点的公钥解密签名,得到Digest,与hash(Message)的值对比,如果相同,即可验证该信息是对应节点发出的。         针对这几点的考虑,区块链节点的密钥管理方案整体结构流程图如下: 1575354560_58_w1119_h598.png        区块链节点中都存有一对公私钥,公钥可用来加密信息,通过私钥解密,

    6.4K83发布于 2020-03-19
  • 来自专栏TASKCTL技术交流讨论

    TASKCTL调度平台服务节点管理

    TASKCTL调度管理平台系统Admin给具有管理员权限的用户,提供了平台级的调度节点管理,系统工程管理,作业类型管理,用户(组)权限管理,常量管理等功能;另外还提供了短信、邮件等平台消息接口配置维护 节点管 平台节点用于管理整个平台的调度控制节点。通过调度服务节点和主代理服务节点,能够部署分布式调度架构;通过主代理以及其下属的从代理,能够部署集群调度架构。 在节点管理的拓扑图页面中,展示了整个平台的网络拓扑结构。如下图所示: ​最上层唯一的调度服务节点:svrnode,用于管理和控制作业的调度策略和指令。 调度服务的下级节点是主代理节点,用于接收调度指令,和执行具体的作业程序。 主代理的下级节点是从代理节点,主代理和从代理一起形成集群节点。 选择需要创建的节点类型(主代理/从代理)和上级节点。 输入节点名称,建议采用英文字符来命名,可以在描述中通过中文备注 输入节点的ip和端口(与后端安装的节点服务一致) 点击确定完成节点的创建。 ​

    83360编辑于 2022-04-01
  • 来自专栏从零学习云计算

    openshiftorigin学习记录(6)——集群节点管理

    采用Cockpit实现集群节点管理。Cockpit是一个开源的系统管理项目。支持Docker、Kubernetes、Openshift。 安装Cockpit 在集群所有的节点上安装Cockpit以及Docker、Kubernetes插件。 # yum install -y cockpit cockpit-docker cockpit-kubernetes 在集群的所有节点上启动Cockpit服务,并设置其开机启动。 - 登录名为root,密码为Master节点root用户的密码。 概览 ? 节点 ? 单节点 ? 结语 之前使用的Openshift Web控制台主要是提供给开发和部署应用的用户使用。 Cockpit提供给集群管理员使用。 实现了用户和管理系统的分离。

    1.4K00发布于 2017-12-28
  • 来自专栏软件测试开发技术

    技术分享 | Jenkins 节点该如何管理

    Jenkins 的任务可以分布在不同的节点上运行节点上需要配置 Java 运行时环境,JDK 版本大于 1.5节点支持 Windows,Linux,MacJenkins 运行的主机在逻辑上是 master 节点图片节点的创建及配置点击 系统管理 -> 节点管理 -> 新建节点 ,用于创建节点:输入节点名称,选择固定节点,点击确定:执行器数量:节点并发执行数量,依据机器性能来配置运行目录:节点存放任务的目录路径标签 启动节点启动节点方式有 2 种,分别是点击 Lauch 下载 slave-agent.jnlp,双击运行点击 agent.jar,下载 jar 包,执行命令启动任意一种方式启动即可,节点启动成功,刷新节点页面 ,可以看到节点已经上线。  图片job 中配置节点信息勾选“限制项目的运行节点”,将之前节点的标签写到此处,这个配置会使之后的构建都会在限制的节点上进行: 图片

    76230编辑于 2022-09-13
  • 来自专栏院长运维开发

    在CEPH管理节点查看卷列表

    [root@node1 ~]# rbd ls volumes volume-0a23a6f1-6e5b-4dcc-803a-8967c5b36a54 volume-10a0c46c-ac7d-4b38-8792-1276e22be669 volume-14e8ce3d-b65c-4035-99a5-2b41f402939f volume-1bb0619e-8975-4e68-9620-ddb57811c3a4 volume-20f7d04e-bcc8-41c5-b41b-aa4c96d3479d volume-239b3f59-c605-48b8-8bf7-9b335821c774 volume-29defce9-8a72-4fcf-9085-716625b81acf volume-2bcc85bb-f7a1-4359-9fa0-5e5fe7e5d5b0 volume-2e01aabf-cf58-4a18-b2dd-d21d786ab8d3 volume-304632ef-304d-4757-8ff7-9ba0f7676b56 volume-30b6711f-6b5f-4727-a62d-bfabee20460d volume-3b9c927b-050c-4345-b8a6-44498a6b113d volume-3e6112a2-72c8-4202-b7ba-494cec86f523 volume-3f8e4976-a77d-4e17-b781-53a23463103d volume-4168507b-4039-48ca-8af2-cffa82bd32e8 volume-494c8621-2258-4a88-a4fe-2094b9b3abcf volume-4b03f7dc-a599-4b74-8448-747e7c8ec2b2 volume-5c0f2212-dcaf-4d6b-a2f6-b3a0cd66a428 volume-5ea8f8d6-7196-4006-bfb8-3060b883d718 volume-5fa5574b-375f-4c73-b474-98c754d8dda1

    2.8K30发布于 2020-06-13
  • 来自专栏AIoT技术交流、分享

    CAN节点错误管理机制分析

    CAN节点的稳定性、可靠性和安全性得益于其强大的错误管理机制。 那么,CAN节点是如何感知和响应错误的呢? 本文将从嵌入式开发的角度,深入分析CAN节点错误管理的工作过程。 在CAN通信中,CAN控制器是实现错误管理的核心,其通过硬件和软件的结合来实现对总线错误的监测和响应。 2 CAN控制器如何感知错误 CAN控制器通过与CAN收发器的交互,实时监测总线的电平状态。 CAN节点的状态转换机制基于错误计数器的值进行。 当节点的错误计数达到某一阈值时,节点会进入错误被动状态,进而影响到其他节点的通信。 在CAN通信中,错误响应机制分为主动错误标志和被动错误标志。 当节点处于“主动错误”状态时,它会发送主动错误标志,通知其他节点发生了错误,并使所有节点丢弃当前出错的帧。 而在“被动错误”状态下,节点仅会丢弃当前出错的帧,不会影响其他节点的通信。 CAN的错误管理机制不仅能提高通信的可靠性和鲁棒性,还能保证数据的一致性。 在CAN网络中,节点能够通过错误管理机制及时识别并响应错误,确保数据传输的正确性。

    46210编辑于 2025-04-26
  • 来自专栏ROS2

    使用LifecycleNode管理节点起停等状态

    在ROS2中,各个节点的状态是可管理的。 在这个场景里,大可让建图程序休眠,而不用杀掉。切换功能时只需要激活相应功能的节点即可。 ROS2中引入了节点生命周期管理的概念,正是为了处理上面描述的问题。 继承LifecycleNode 来实现自己的节点节点名称注册到Lifecycle Manager 中,由它来管理各个节点的状态 实现一个功能通常需要一些节点互相配合来实现。 这样的话,我们可以将某一个功能涉及到的节点使用一个Lifecycle Manager 程序来管理。从而实现了起停一项功能的效果。 ROS2中的节点类型 ROS2中提供了两种节点类型。 Node() 是和ROS1中一样的节点基类 LifecycleNode() 是可管理状态的节点基类 这里详细说说LifecycleNode() 节点类型。 如何管理LifecycleNode 节点的状态 LifecycleNode 节点提供了切换状态的服务,所以可以通过外部程序通过服务请求的方式来管理LifecycleNode 节点的状态切换。

    2.8K20编辑于 2022-04-18
  • 来自专栏Jenkins

    利用 Kubernetes 内置 PodTemplate 管理 Jenkins 构建节点

    熟悉 Jenkins 的用户,都知道 Jenkins 支持多种类型的构建节点,例如:固定配置、动态配置。而节点与控制器连接的方式, 又包括:JNLP、SSH 等。 对于已经在全面拥抱容器技术的用户,大多数是通过连接 Kubernetes 集群并动态启动、销毁 Pod 的方式来使用构建节点。 而随着构建节点的种类、数量增多后,如何更有效地维护这些基于 Kubernetes 的节点,则逐渐成为一个问题。而在这篇文章中, 我将会介绍一种基于配置即代码的方案来管理、维护构建节点。 回归到我们希望解决的核心问题上来,预期的方案是:只需要单独维护 PodTemplate 即可实现对 Jenkins 构建节点的维护。 然后,你可以创建一个流水线来测试对应的节点

    1.8K30编辑于 2022-12-01
  • YashanDB多节点集群部署及管理技巧

    本文将深入解析YashanDB多节点集群的体系架构、部署策略及关键管理技巧,旨在帮助开发人员和数据库管理员充分发挥YashanDB集群的性能优势及稳定性保障。 崖山集群服务(YCS)负责集群管理和高可用保障,确保在节点故障时快速切换和集群重组,保证服务的连续性。部署形态与配置参数优化多节点集群的部署需基于业务规模和性能需求合理选择部署形态。 关键管理技巧:性能与高可用保障YashanDB多节点集群的管理重点围绕资源调配、故障诊断和数据一致性保障展开。合理利用主备复制和共享集群的自动选主机制,可有效降低手动运维的复杂性。 存储与数据管理策略存储管理是多节点集群稳定运行的基础。YashanDB通过逻辑存储结构与物理存储结构分离,增强存储管理的灵活性与扩展性。段页式管理结合大小可配置的数据块和区,支持动态空间申请与回收。 安全与权限管理强化多节点集群部署环境数据库安全至关重要。YashanDB以角色为核心的访问控制体系配合三权分立原则实现安全管理,分离DBA、安全管理员及审计管理员角色,防范权限滥用风险。

    19810编辑于 2025-08-18
  • 来自专栏CNCF

    大咖的建议,用KubeEdge管理边缘节点

    边缘云计算,我们可以简单的理解为是将在一定的架构基础上,对于我们所需要的程序、数据等资料的运算,由中心节点去处理提升为由中心节点推送到边缘节点去处理,这样的好处是既可以合理分配资源,又可以节省大量的时间 ,而且降低了中心节点的压力,保持了全局的稳定高效。 KubeEdge——华为在用的一种运用于Kubernetes架构平台的管理方案,或许对我们有更好的启迪与借鉴。 在此之前,她是 Microscaling Systems的首席执行官、MicroBadger(一种管理 容器元数据的工具)的开发者之一。 她在网络协议和分布式系统以及数字技术领域,如视频点播 (VOD)、音乐和互联网协议电话(VoIP)等方面拥有丰 富的软件开发、团队和产品管理经验。 ?

    2K40发布于 2019-12-06
  • 来自专栏用户5447549的专栏

    从源码角度分析ScheduleMaster的节点管理流程

    借助于ASP.NET Core框架的HostedService模型,我们把生命周期管理器封装在一个后台托管服务AppLifetimeHostedService中,在它的StartAsync方法中注册了我们需要的事件 手动注册模式 自动注册模式虽然流程简单,但是需要提前配置好节点信息,这对于节点弹性部署并不友好,因此为了增加系统灵活性,系统也提供了手动注册节点的模式,这时候对worker注册的主动权转移到master workerof指定归属的master名称 在控制台中对节点执行[连接]操作,master携带验证信息对worker发起连接请求 如果验证通过,则使用指定的节点名称去数据库查询完整的节点配置信息 ,并为worker节点缓存配置数据,worker生成一个新的访问秘钥返回 标记节点状态为空闲中,此时worker并不运行任何调度服务,处于空跑状态 对节点执行[启用]操作,开启调度功能 : 读取系统配置的最大允许无响应次数 给节点维护一个失败计数器,本质是一个字典,key是节点名称,value是连续失败的次数 对节点发起健康检查请求,如果请求成功就更新节点的最后刷新时间,

    75320发布于 2020-10-28
  • 来自专栏维C果糖

    HDFS 集群无法启动 DataNode 节点以及管理界面缺少 DataNode 节点的解决方法

    节点也运行正常, 可以在各自的虚拟机中用jps命令查看正在运行的 Java 进程,但是通过http://master:50070/dfshealth.html#tab-datanode查看数据节点,却发现可视化管理界面仅显示了一个 DataNode节点,另一个数据节点缺失。 NameNode节点,而两个DataNode节点启动失败。 通过解决ISSUE 1,我们知道了在 HDFS 集群的图形化管理界面的Datanode usage histogram中,显示的数据节点是根据主机名进行区分的,如果数据节点的主机名都相同,就是导致虽然数据节点正常启动 ,但却不会在管理界面中显示的问题。

    4.9K20发布于 2019-05-26
  • 来自专栏用户5447549的专栏

    从源码角度分析ScheduleMaster的节点管理流程

    借助于ASP.NET Core框架的HostedService模型,我们把生命周期管理器封装在一个后台托管服务AppLifetimeHostedService中,在它的StartAsync方法中注册了我们需要的事件 手动注册模式 自动注册模式虽然流程简单,但是需要提前配置好节点信息,这对于节点弹性部署并不友好,因此为了增加系统灵活性,系统也提供了手动注册节点的模式,这时候对worker注册的主动权转移到master 或者命令行参数workerof指定归属的master名称 在控制台中对节点执行连接操作,master携带验证信息对worker发起连接请求 如果验证通过,则使用指定的节点名称去数据库查询完整的节点配置信息 ,并为worker节点缓存配置数据,worker生成一个新的访问秘钥返回 标记节点状态为空闲中,此时worker并不运行任何调度服务,处于空跑状态 对节点执行启用操作,开启调度功能 验证连接过程的核心代码为 : 读取系统配置的最大允许无响应次数 给节点维护一个失败计数器,本质是一个字典,key是节点名称,value是连续失败的次数 对节点发起健康检查请求,如果请求成功就更新节点的最后刷新时间,并把计数器归0

    89440发布于 2020-06-17
  • 来自专栏Cloud-DIY

    【FusionCompute】添加CNA主机到VRM管理节点(四)

    文章目录 一、实验说明 二、实验操作 1、登录VRM管理后台 2、创建集群 3、添加CNA主机 三、实验总结 一、实验说明 本实验一开始使用的是FusionCompute 8.0.0版本进行实验,在VM 虚拟机上安装完CNA主机后,使用FusionCompute_Installer-8.0.0工具安装VRM管理节点时,中途发生报错,提示添加主机过程中刷新资源失败,请检查系统状态。 在完成VRM的安装后,通过WEB浏览器,登录VRM的管理平台,尝试添加之前创建好的CNA主机,但还是提示,发生报错信息,提示添加主机过程中刷新资源失败,请检查系统状态。 之后,采用FusionCompute 6.5.1版本的进行实验,采用挂载CNA和VRM镜像的方式,分别创建了两台虚拟机,登录VRM管理平台,尝试添加CNA主机,成功添加。 三、实验总结 添加CNA主机至VRM管理平台,整体较为简单。但是在使用VM虚拟机进行演示操作时,发现不是很兼容,容易出错。

    4.3K21编辑于 2022-12-13
领券