下述操作均需要在具体运行服务的那个节点上运行,而不是admin节点!!! 数据回填和恢复操作可能会产生大量的后端流量,影响集群性能。 为避免性能降低,可对回填/恢复操作进行配置: osd_recovery_op_priority # 值为1-63,默认为10,相对于客户端操作,恢复操作的优先级,默认客户端操作的优先级为63,参数为osd_client_op_priority ,默认为10 osd_backfill_scan_min # 回填操作时最小扫描对象数量,默认为64 osd_backfill_scan_max # 回填操作的最大扫描对象数量,默认为512 osd_backfill_full_ratio 如果ceph的monitor节点超过半数挂掉,paxos算法就无法正常进行仲裁(quorum),此时,ceph集群会阻塞对集群的操作,直到超过半数的monitor节点恢复。
大多数运维工程师的手机里,常年装着VPN、SSH客户端、各种云控制台的App,随时准备"被叫醒"。但用手机处理运维问题,体验一直很糟糕——屏幕小、操作复杂、很多功能手机端根本没有。这种情况正在改变。 移动端运维的真实需求先把需求说清楚。运维工程师在手机上真正需要的是什么? "手机上输命令很痛苦不支持云控制台层面的操作方案三:腾讯云CloudQ+企业微信/飞书(推荐)把运维能力接入你本来就在用的IM工具,不需要额外App,不需要切换界面。 CloudQ移动端运维:在聊天框里管云腾讯云CloudQ的移动端方案,本质是把云运维能力嵌入企业微信、飞书、钉钉等IM工具。 实测数据某电商团队接入腾讯云CloudQ后的变化:指标接入前接入后大促值班人员6人2人告警平均响应时间28分钟4分钟非工作时间处理告警耗时15-20分钟(开电脑)不到1分钟(手机)运维工程师满意度—明显提升
常用操作 2.1 查看pg组映射信息 $ ceph pg dump 2.2 查看一个PG的map $ ceph pg map 1.2f6 osdmap e7768 pg 1.2f6 (1.2f6) ->
常用操作 2.1 查看pool里所有镜像 $ rbd ls rbd 03aa248c-0de5-45e5-9c2b-5fe26b230275 97ee910f-8427-4b58-9b6a-4ed3df7049d0
常用操作 2.1 查看pool数量 $ ceph osd lspools 1 rbd,2 test_data,3 test_metadata,5 test,6 benmark_test,7 .rgw.root 18 size to 3 2.11 查看pool池副本数 $ ceph osd pool get test_lihang size size: 3 2.12 设置pool池写最小副本 #设置pool池写操作最小副本为
常用操作 2.1 查看mds的状态 $ ceph mds stat test_fs-1/1/1 up test1_fs-1/1/1 up {[test1_fs:0]=ceph-xx-osd03.gz01
常用操作 2.1 查看mon状态 $ ceph mon stat e1: 3 mons at {ceph-xx-osd00=10.69.0.1:6789/0,ceph-xx-osd01=10.69.0.2
1.说明 1.1介绍 RADOS全称Reliable Autonomic Distributed Object Store,是Ceph集群的精华,用户实现数据分配、Failover等集群操作。 2. 常用操作 2.1 查看集群多少个pool $ rados lspools rbd test_data test_metadata test benmark_test .rgw.root default.rgw.control
常用操作 2.1 查看osd状态 $ ceph osd stat 5 osds: 5 up, 5 in 状态说明: 集群内(in) 集群外(out) 活着且在运行(up) 挂了且不再运行(down) 说明 #有时候某个 OSD 与其它的相比并不适合做主 OSD (比如其硬盘慢、或控制器慢),最大化硬件利用率时为防止性能瓶颈(特别是读操作), #你可以调整 OSD 的主亲和性,这样 CRUSH 就尽量不把它用作 如果你不想在停机维护 OSD 时让 CRUSH 自动重均衡,提前设置 noout $ ceph osd set noout 2.26 取消停止自动均衡 #跟ceph osd set noout相反的操作
基本概念 1.1 什么是 Scrub Scrub是 Ceph 集群副本进行数据扫描的操作,用于检测副本间数据的一致性,包括 scrub 和 deep-scrub。 配置 为了避开客户业务高峰时段,建议在晚上0点到第二天早上5点之间,执行scrub 操作。 2.1 设置标识位 在任一monitor节点进行如下操作: ceph osd set noscrub ceph osd set nodeep-scrub 2.2 临时配置 先通过tell 方式,让scrub 时间区间配置立即生效,在任一monitor节点进行如下操作: ceph tell osd.* injectargs '--osd_scrub_begin_hour 0' ceph tell osd.* 0点 osd_scrub_end_hour = 5 # scrub操作的结束时间为5点#ps: 该时间设置需要参考物理节点的时区设置 osd_scrub_chunk_min = 1 #标记每次
为了更好地推进运维领域技术交流发展,并且让更多的企业能够完成向云计算的转变,腾讯云和织云联合举办“腾讯云运维干货” 系列沙龙。 每期沙龙将会邀请腾讯运维领域专家,分享云计算时代运维的思考和实践,并且为参加沙龙活动的人员提供一定金额的腾讯云代金券,帮助大家0门槛体验腾讯云上各类云产品,而针对企业用户,腾讯云“云+创业”计划更是能给出高达百万的云资扶持 沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。 [图片] (腾讯手机QQ运维负责人郭智文) 手机QQ运维负责人郭智文为大家带来的 《手机QQ 移动网络接入优化之路》技术分享,以手Q运维的故障案例,引出移动互联网时代手Q业务面临的挑战与运维的优化之路,包括业务架构部署优化、海量用户的全局智能调度和运维对移动网络的优化经验,每个技术点
操作 CRUSH Map 2.1 提取CRUSH Map #提取最新crush图#ceph osd getcrushmap -o {compiled-crushmap-filename} $ ceph 一个桶的权重是一维的,你也可以计算条目权重来反映存储设备性能。 最大化硬件利用率时为防止性能瓶颈(特别是读操作), 你可以调整 OSD 的主亲和性,这样 CRUSH 就尽量不把它用作 acting set 里的主 OSD 了。
add-remove-osd-s-3010589e52a0-52209664osd3011 增加mon Mon增加之前需要像上面的增加osd那样先去初始化好机器,特别是机器的hostname,ceph依赖高版本的内核,如果是操作系统首选 centos7(centos6要退出历史舞台了),hostname中不要带- \等之类的特殊操作符号,就中规中矩字母+数字。 {mon-id} 或者 /etc/init.d/ceph stop mon 清理mon map ceph mon remove {mon-id} 运维大多是起起停停,要想少点这种体力活,事先要有一个好的规划 这是一些比较常用的操作: 创建一个远程块设备,指定大小为100GB rbd create --size 102400 foo(默认使用rbd的pool,也可以这样指定rbd create bar --size
2、下载后提取.iso里面的kernel.WIM 3、用Dism++x64.exe加载上步的.WIM文件给它集成腾讯云驱动 dism++官网:http://chuyu.me/zh-Hans/ 选择.WIM 文件和挂载位置(需要空文件夹,并且有写权限)后点确定,等加载进度走完后会看到"打开会话"字样,鼠标放上去是个小手图标,如下图 4、点一下左侧的"驱动管理",然后点右下侧的"添加驱动",选择腾讯云Win11 pwd=br4h 提取码: br4h 7、参考我这篇文档:怎么挂维护盘到开机启动项,安装easybcd,把集成好腾讯云驱动的win11pe iso集成到开机启动项,这样开机的时候就能看到win11pe
关于Hyper,大家比较好奇,本文将从三个方面重点分享Hyper的原理和容器云运维:从Docker到Hyper Container,Hyper Container用于公有云,容器云上运维的变化。 不同之处在于,这个hyper客户端虽然装在用户的电脑上运行,但它的所有操作最终都落在我们的云端,直接操作云上的资源。 容器云上运维的变化 最后想分享一下我对于容器时代运维的一些思考。在容器时代,很多运维理念跟以前不太一样了。 资源视角。以前,资源就是机器,不管是物理机还是虚机。 传统的运维方式,就是就是把应用的二进制文件编译好了扔到服务器上,替换旧的,重启服务,发现有问题赶紧把旧文件换回来,回滚服务,这是典型的变更方式。 一开始运维可能很不适应,但是我相信未来的趋势是容器,我们要往这个方向去努力。
当手机屏幕亮起熟悉的Windows 7开机画面,指尖滑动间竟能像操作电脑一样拖拽窗口、截图保存,甚至播放本地音乐——这种“手机变电脑”的奇妙体验,正被一款名为“直装小电脑plus”的安卓应用变为现实。 从经典的蓝底开机画面到桌面图标排列,甚至任务栏的电池电量显示,都力求还原真实电脑操作感。无论是突然需要处理文档、查看压缩包,还是想重温经典系统的交互逻辑,它都能成为你的“掌上备用机”。 它支持文件管理器,可浏览手机存储与SD卡内容,查看文件夹大小、修改日期;长按文件还能直接分享或通过文本、音频、视频格式打开未知类型。 压缩解压ZIP、屏幕自动旋转、下滑调出任务栏等设计,让操作效率大幅提升。更贴心的是,桌面支持自定义快捷方式与5个主屏幕切换,右上角快速启动栏可放常用应用,细节处尽显对用户习惯的尊重。 它或许无法替代真正的电脑,但在应急场景下,能快速处理文档、播放文件、截图分享的功能,已足够成为手机里的“效率补丁”。
传统的运维( Ops)没有消失,只是在重组。 云服务的发展看起来让运维人员“丢”了工作,因为从传统意义上说,从本地(on-premise)转移到云平台意味着运维工作在相当大程度上外包给云提供商。 现如今的运维团队,应该重新定义他们的愿景。 运维的未来是要使开发者能够通过工具、自动化和流程实现自助服务,并使他们能够通过最小的运维干预来部署并运行服务。 其实新运维模式本质上应该把运维看作是一个产品团队,其产品就是基础设施。 DevOps 在很多方面正让开发者跟运维人员感同身受。新运维正好相反。殉道者式的运维团队相当自以为是,他们根本没有做好足够的工作将权利和责任转给开发团队。 随着运维工作转移到云,它需要给予开发团队更多的权利和信任以重塑自身,而不是“闭关锁国”。 运维长存! 【本文转自 36氪 】
作者丨周小军,腾讯SNG资深运维工程师,负责社交产品分布式存储的运维及团队管理工作。对互联网网站架构、数据中心、云计算及自动化运维等领域有深入研究和理解。 沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。 [图片] 上图是织云的一键上云页面,左边是管理列表,右边是服务器属性。包括它属于哪个模块,IP是多少,什么机型,运营状态,操作系统,监控等等。 [图片] 变更具备交付后不管的能力。 织云高效的实践是,它是以运维标准化为基石,以 CMDB 为核心的自动化运维平台。通过 Web 界面的一键式上云,基于业务原子任务和流程引擎,形成一个完整的运维流程,最后并行执行。 相关文章 腾讯云运维干货沙龙-海量运维实践大曝光 (一) 腾讯云运维干货沙龙-海量运维实践大曝光 (二) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3
exit quit the mongo shell > 这是MongoDB最顶层的命令列表,主要告诉我们管理数据库相关的一些抽象的范畴:数据库操作帮助 、集合操作帮助、管理帮助。 如果你想了解数据库操作更详细的帮助命令,可以直接使用db.help(),如下所示: > db.help() DB methods: db.adminCommand(nameOrDocument) ,不允许执行写数据操作,一般在执行数据库备份时有用。 terminate the fsync write/snapshot lock" } 其中,fsyncLock为1表示MongoDB的fsync进程(负责将写入改变同步到磁盘)不允许其他进程执行写数据操作
作者丨魏旸:腾讯高级工程师,具有15年运维经验的专家。负责QQ空间、微云、QQ空间相册等的运维工作。 12月16日,首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。 沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。 [图片] [图片] 相关文章 腾讯云运维干货沙龙-海量运维实践大曝光 (一) 腾讯云运维干货沙龙-海量运维实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3