首页
学习
活动
专区
圈层
工具
发布

#集群

Kubernetes externalIPs:已知六年的安全漏洞,终于要移除了

乱世不浮生

局限性:依赖 Kyverno 本身的可用性,Kyverno Pod 不可用时策略失效,建议将 failurePolicy 设为 Fail 以确保安全性优先;多集...

3100

不止于网络:从 Cilium 2025年度报告,洞察云原生基础设施的六大演进

乱世不浮生

单集群时代已成过去,多集群架构成为标准。“单集群时代”就像当年的“单体应用时代”一样,虽然简单,但随着规模扩大,它变成了脆弱的单点故障源。多集群架构的普及,本质...

1200

Redis常见问题->缓存穿透**缓存击穿 **缓存雪崩**缓存预热**集群脑裂**详解及解决方案

wuzhigang

缓存穿透 缓存穿透是指用户请求的数据在缓存中不存在即没有命中,同时在数据库中也不存在,导致用户每次请求该数据都要去数据库中查询一遍,然后返回空。

3300

同一条SQL,单机秒回,分布式集群卡成PPT——问题究竟出在哪?

PawSQL

凌晨三点,监控面板显示:CPU飙到85%,网络IO接近饱和,数据库连接数暴涨。翻开慢查询日志,一条报表SQL映入眼帘——

5300

OCP 白皮书:OCS光交换技术、部署与未来全景解析

光芯

本文依据开放计算项目(OCP)2026年4月发布的白皮书,介绍OCS技术体系、实现路径、规模化部署实践与未来演进方向。

5710

DesignCon2026 光互联论坛OIF:AI应用高能效互联技术全面解读

光芯

AI计算集群采用三级互联架构,不同层级链路的技术要求差异显著,直接决定了高能效接口的设计方向。最底层是Scale-up(集群内)互联,负责同一Pod内加速器之间...

8110

3D集成光学破局万亿参数MoE训练:Lightmatter Passage实现2.7倍加速与8倍集群扩展

光芯

Transformer模型自2017年诞生以来,参数规模从最初的65M增长至如今的万亿级,训练所需的GPU数量也从单节点8卡扩展到数据中心级的数万卡。MoE架构...

7410

OFC 2026深度:Scale Across重构AI数据中心网络,千兆瓦级集群的光互联革命

光芯

Meta骨干网架构团队的Jeff Rahn首先分享了Meta全球基础设施的演进逻辑。Meta目前在全球拥有数十个数据中心,覆盖北美、欧洲、新加坡等地区,其全球骨...

7210

OFC 2026 Optica Executive Forum:AI数据中心Scale-Up光互联技术(Meta/Marvell/Ciena/Arista)

光芯

Meta首先披露了其AI基础设施的扩张规模:服务全球34亿日活用户,单日WhatsApp消息量超2000亿条;2025年已部署超130万张GPU,后续还将部署数...

5310

OFC 2026 Workshop:分布式AI训练长距互联边界——多远才算太远?(二)

光芯

OFC 2026 Workshop:分布式AI训练的互联延迟边界——多远才算太远?(一)

4510

OFC 2026 Workshop:分布式AI训练的互联延迟边界——多远才算太远?(一)

光芯

2026年3月15日,OFC 2026于美国洛杉矶举办主题为《How Far is Too Far? Interconnect Latency and Dist...

4610

OFC2026:AI Scale-Up互连的技术路线与产业化进展

光芯

本次研讨会以能效(pJ/bit)、带宽密度、可靠性、延迟、可扩展性为五大核心评价维度,形成了清晰的技术演进共识与差异化路线布局:

5010

一文读懂 EMS:光储充设备的全能指挥官(光伏、储能、充电桩、电表)

文慧的科技江湖8676

虚拟电厂 = 无数个大脑的集群联盟。单个微电网体量太小,无法参与电网交易。通过云端聚合所有EMS管控的站点,将碎片化的电力资源打包成可调度、可交易的大型资源池,...

6810

第132期 Oracle Linux 10.1操作系统Oracle 26ai 2节点RAC搭建步骤(保姆级)

用户7148769

现在可以使用pcs cluster rename <新名称>命令对集群进行重命名,减少了手动操作步骤。该命令会更新所有相关的集群属性,确保重命名后集群继续无缝工...

4910

记openGauss社区正式发布业界首个开源多写数据库oGRAC的20天日子

用户7148769

开源是死,不开源也是死---记openGauss社区正式发布业界首个开源多写数据库oGRAC的20天日子

5310

腾讯云应用云渲染 vs 自建 GPU 集群:成本、运维与扩展性的全面对比

hollyx

自建 GPU 集群门槛高、扩缩容慢,腾讯云应用云渲染(CAR)以 PaaS 形态按并发付费,端到端延迟 60-80ms,2000+ 边缘节点就近接入,1 天即可...

6610

日常Bug排查-集群逐步失去响应

无毁的湖光-Al

最近碰到一个产线问题,表现为某个应用集群所有的节点全部下线了。导致上游调用全部报错。而且从时间线分析来看。这个应用的节点是逐步失去响应的。因为请求量较小,直到最...

6600

Clickhouse 3节点负载不均衡问题分析

用户11162737

应用反馈三节点集群中,在应用负载均衡的情况下,其中一个节点的负载比其他节点高出4倍左右,需要分析根因。

7710

k0s 使用教程:轻量级 Kubernetes 发行版,单文件部署 K8S 集群

代码简单说

k0s、k0s教程、k0s安装教程、Kubernetes发行版、轻量级Kubernetes、k0sctl、K8S集群部署、Kubernetes高可用、边缘计算K...

8510
领券