首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏运维部落

    浅谈

    流程 工具 质量 工程 image.png 大家好,我是史丹利「Stanley」,今天聊聊。 最近CTO在梳理公司方案,老板希望我能多提点建议看法。 回到这处话题,我的理解有几个维度: 流程 工具 质量 工程 流程 image.png 最短路径 流程是双刃剑,大家都知道。 k8s解决了的高可用,高并发,扩缩容的架构能力。 回归到本质,还是要用技术手段去解决人的因素。 工具 image.png imag2 工具,在传统公司越来越被重视,但重视度有待商榷。 个人觉得,我们还是缺懂产品的人。 质量 质量管理不在我们的管理范畴,我们不做过多讨论,问题大家都看的到,不做无意义讨论 工程 image.png 闭环 工程很关键,是所有事情的源头。

    1.1K20发布于 2021-03-30
  • 来自专栏Tencent Serverless 官方专栏

    利器——事件总线「链路追踪功能」正式发布

    目前,事件总线已正式支持链路追踪功能,完成每条事件从产生到消费的完整日志上报,提升产品可观测性,方便用户进行业务的。 详细配置流程和上报信息,请参考腾讯云官方产品文档:https://cloud.tencent.com/document/product/1359/72371 欢迎扫描下方二码,免费咨询解决方案

    80320编辑于 2022-04-27
  • 腾讯云可观测平台AI驱动与主动防护实践

    直面被动救火与未知风险防控瓶颈 企业维面临被动救火式响应核心痛点:传统模式依赖人工排查,跨云服务链路根因定位难,未知风险无法主动发现,专家经验门槛高导致排障效率低。 理想需从“事后处置”转向“事前防护”,现实却受限于数据割裂、分析能力不足,形成效率与风险防控的双重瓶颈。 Agentic模式变革: Memory核心价值:跨云服务链路智能根因定位,突破“未知”限制主动发现风险; MCP知识沉淀:知识双飞轮(边用边沉淀腾讯经验与企业知识),专家经验产品化降低技能要求 验证分钟级排障与免降本增效价值 应用效果聚焦可量化ROI指标(数据来源:腾讯云可观测平台2023-2024一体化产品演进说明): 排障效率:打通云资源与应用层关联,典型问题实现分钟级定位; 成本:Prometheus监控服务提供高可用全托管、免服务,集成腾讯云50+云产品,减少运投入; 开发效率:APM基于多语言探针零配置获得开箱开发现性能瓶颈能力,支撑业务上线压测与大促备战

    24110编辑于 2026-04-16
  • 来自专栏AIOps

    智能赋能:基于LLM的故障处置和智能引导系统

    直达原文:智能赋能:基于LLM的故障处置和智能引导系统01.引言:可观测性驱动的智能转型在分布式与云原生架构普及的背景下,企业IT系统复杂度激增,传统人工运模式难以应对跨域故障定位与处置效率的挑战 基于大模型技术(LLM)的知识库系统,通过整合可观测数据(指标、日志、链路)与私域知识,实现故障的智能诊断与预案推荐,成为企业转型的核心抓手。 系统通过抽取企业历史故障记录、手册、技术文档等非结构化数据,结合可观测平台采集的实时指标(Metric)、日志(Log)、追踪(Trace)数据,构建专属知识图谱。 02.结语:从被动响应到主动预防的质变嘉为蓝鲸小鲸观测助手通过LLM技术,将可观测性数据转化为可行动的知识,实现了故障处置从“人工经验驱动”向“AI主动治理”的升级。 未来,随着大模型与可观测体系的深度协同,知识库将进一步向自主分析-决策-执行的智能化阶段演进,为企业构建“事前预防、事中快速处置、事后持续优化”的韧性体系。

    77510编辑于 2025-06-23
  • 打破车云架构监控孤岛:阿塔基于可观测平台的智能实践与

    塔在快速推进业务迭代时,现有的与监控体系面临三项核心战略困境: 架构演进加剧瓶颈定位难度: 车云系统包含车载终端、网络接入、云端服务至AI计算的完整链条,模块众多且依赖紧密。 由于缺乏AI驱动的分析引擎支撑,团队深陷于“被动救火”与告警风暴的循环中。 闭环主动式与知识双飞轮: 将从“事后补救”前置为“主动防御”。涵盖事前容量规划与混沌工程压测,事中秒级定界与工单联动自动修复,事后结构化复盘生成改进资产。 深化数字分身与全生命周期安全布局 面向未来出行的复杂场景,可观测能力正向更深维度的智能化与安全融合演进。 —— 孙旸,阿总监

    16410编辑于 2026-04-15
  • 来自专栏AIOps

    企业降本!2025嘉为蓝鲸秋季更新自动中心V3.1:SQL与界面巡检双场景加持,大模型融合优化体系

    官网原文(免费申请演示):嘉为蓝鲸自动化中心V3.1:新增两大场景、大模型赋能、场景全面优化,构建更安全更高效的自动化体系嘉为蓝鲸自动化中心·鲸舟(简称:自动化中心)是面向IT团队打造的一款全栈式一体化自动化工具 ,致力于保证安全的同时减少手工运操作,体系化、规范化提升自动化率,将IT工程师的精力从复杂性及重复性的日常工作中释放出来。 SQL取数查数企业IT团队一般需要多种类型的数据库,相关的活动有业务系统版本更新时的SQL发布、协助开发人员查询生产数据的取数查数、做故障环境模拟时导出生产数据等。 为什么推荐您选择嘉为蓝鲸自动化中心?嘉为蓝鲸自动化中心以 “解决痛点、驱动业务” 为核心,从权威认证、核心产品优势到可量化客户价值,成为企业升级优选。 AI 智能赋能降本:通过 AI 智能脚本生成功能,减少 70% 的脚本编写工作量;智能报告解读功能将传统 2 小时的报告分析时间压缩至 10 分钟,从 “人工操作” 向 “智能决策” 跨越,加速智能化升级

    56210编辑于 2025-09-12
  • AI+云原生应用开发 从设计到部署全链路实战与

    在数字化转型的浪潮中,企业越来越多地采用云原生方法来构建和运行应用程序。结合人工智能(AI)技术,云原生应用能够实现更高的智能化和效率。本教程将详细介绍云原生应用的开发过程,以及如何设计和开发 AI+云原生应用的架构。

    1.4K10编辑于 2024-08-20
  • 来自专栏薛定喵君

    中国版 Cursor 助力智能:CodeBuddy Craft 开发Jenkins日志大模型分析工具200%?

    背景公司项目内部协作时经常会遇到系统发版失败的问题,前后端同学不会查看Jenkins的发版日志来判断前后端或者的问题,沟通效率不高,需要一个"工程师"帮忙分析。

    59100编辑于 2025-05-13
  • AI+云原生应用开发 从设计到部署全链路实战与教程

    一、为什么今天大家所期待的和当时 APP Store 出现时那样,AIGC 应用的蓬勃发展并没有出现?本质是 AI 的拐点还没有到。

    84910编辑于 2024-08-21
  • 来自专栏光城(guangcity)

    C++网站

    C++网站 大家好,我是光城,统一回复:C++那些事网站服务器到期,暂时关闭,大家直接阅读github或公众号内容即可。

    59230编辑于 2022-03-29
  • 来自专栏不换的随想乐园

    Mac 工具录

    前不久经历了一次 Mac 换机,从 m1 换机到了 m2,一些工具的迁移这里做一个记录。

    20510编辑于 2024-04-30
  • 来自专栏『学习与分享之旅』

    IDEA 2026.1 三招

    今天刷到 IntelliJ IDEA 2026.1 的更新页,第一反应不是兴奋,是松一口气。

    17510编辑于 2026-04-26
  • 来自专栏精益六西格玛资讯

    ,你需要DOE试验设计!

    DOE实验设计是一种安排实验和分析测试数据的数理统计方法。DOE测试设计主要是合理安排测试,以较小的测试规模、较短的测试周期、较低的测试成本获得理想的测试结果和科学的结论。

    92840编辑于 2022-12-13
  • 来自专栏前端开发面经

    vue的几个技巧

    如图,这是一个v-for渲染的列表(只是目前这个版块才刚开始做,目前只有一个),圆圈内的就是一个组件,也就是要v-for动态组件

    87190编辑于 2022-11-02
  • 来自专栏AIOps

    2026全栈智能可观测选型指南:精准匹配产品,赋能与数字化升级

    2026年,数字化转型进入深水区,云原生、分布式架构成为主流,混合云部署与信创适配成为企业刚需,监控已从“被动告警”升级为“主动观测、智能预判”的核心能力。 本文聚焦四款主流监控系统,从核心定位、能力亮点、适用场景三度深度解析,帮你快速锁定2026年最优解决方案。 LLM+AI双赋能,降低门槛:内置“小鲸”智能助手,支持DeepSeek、ChatGPT等大模型,提供知识库推荐、故障处置引导、根因辅助分析;结合时序预测、异常检测等AI算法,实现动态阈值告警、 03.企业监控选型常见FAQQ1:混合云架构+信创转型,如何兼顾监控兼容性与功能完整性? 避免同时部署多款全栈工具,增加复杂度。Q3:中小团队预算有限,如何选择高性价比方案?

    38110编辑于 2026-03-09
  • 来自专栏WeTest质量开放平台团队的专栏

    【干货分享】研优化实践:WeTest测试

    接下来,本文将分享一些使用WeTest进行测试的小经验,希望能帮到大家。

    1.1K10编辑于 2022-01-14
  • IDEA 2026.1 三招

    今天刷到 IntelliJ IDEA 2026.1 的更新页,第一反应不是兴奋,是松一口气。

    19110编辑于 2026-04-29
  • 构建游戏全生命周期技术底座:高并发承载、全球化部署与实践概要

    随着游戏内交互复杂度与AI应用深化(如《开心消消乐》单日AI推理打关任务超 1亿次),底层数据库与计算实例需要处理 百TB级 的存储与极高的查询频次(QPS),如何在提升算力的同时控制单次推理与整体成本成为关键 驱动核心业务指标跃升与研发运 基于标准化的云原生架构与护航体系,多款头部游戏在核心业务指标、系统稳定性及效率上实现了量化突破(数据来源:腾讯游戏云案例实践): 突破性能与吞吐上限: 助力《开心消消乐 压降与资源成本(Ops Cost): 《咸鱼之王》成功应对每分钟 100GB+ 的日志波峰,通过弹性资源调用显著提升资源利用率并降低了单次交互成本;《指尖无双》借助 TCOP 一体化可视监控,大幅降低云上门槛 undefined—— 库洛游戏 (Kuro Games) 《鸣潮》项目团队 沉淀全生命周期护航能力,铸就确定性增长基石 面对日益复杂的游戏生命周期管理,单点技术优化已无法满足研一体化的需求。

    10710编辑于 2026-05-31
  • 来自专栏Java3y

    神器!hades规则引擎

    没更新文章的这些天一直在写hades项目(Java轻量级规则引擎),这两天发布了个新的版本v1.0.4。

    1.1K50编辑于 2023-08-25
  • 来自专栏前端开发面经

    vue的几个技巧

    如图,这是一个v-for渲染的列表(只是目前这个版块才刚开始做,目前只有一个),圆圈内的就是一个组件,也就是要v-for动态组件 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CgstVJ6d-1665390342414)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/018edf494b164a3b806e550acf4879d8~tplv-k3u1fbpfcp-zoom-in-crop-mark:4536:0:0:0.image)

    82200编辑于 2022-10-10
领券