首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏肉眼品世界

    面向FaaS的异构调度技术

    图2 网络资源供给模式变革 什么是异构 什么叫“”? 通过网络来协同和纳管调度异构,构建起“云、边、端”一体的异构协同网络,从而更好的满足包括高性能计算、物联网、边缘计算、人工智能等众多场景的需求。 图3 异构满足多场景需求 什么是FaaS 的纳管和协同调度离不开云计算和云原生,在网络中采用云计算和云原生来实现“云、边、端”的统一纳管和资源调度是目前实现异构共享的主流技术手段。 综上所述,围绕通过Serverless 进一步屏蔽底层异构的差异性,如何实现更好的协同和部署,以及发挥异构效能目前是新技术发展的热点领域,随着我国一体化枢纽计算中心的大规模建设和部署 2021年,中国联通网络团队在业界首次提出了异构统一标识和服务化,并且发布了业界首本关于异构的白皮书《异构统一标识与服务白皮书》;2021年,提出了异构标识体系,并在CCSA成功立项异构力系列标准立项

    1.7K20编辑于 2022-06-15
  • 来自专栏SDNLAB

    面向FaaS的异构调度技术(附PPT)

    图2 网络资源供给模式变革 什么是异构 什么叫“”? 通过网络来协同和纳管调度异构,构建起“云、边、端”一体的异构协同网络,从而更好的满足包括高性能计算、物联网、边缘计算、人工智能等众多场景的需求。 图3 异构满足多场景需求 什么是FaaS 的纳管和协同调度离不开云计算和云原生,在网络中采用云计算和云原生来实现“云、边、端”的统一纳管和资源调度是目前实现异构共享的主流技术手段。 综上所述,围绕通过Serverless 进一步屏蔽底层异构的差异性,如何实现更好的协同和部署,以及发挥异构效能目前是新技术发展的热点领域,随着我国一体化枢纽计算中心的大规模建设和部署 2021年,中国联通网络团队在业界首次提出了异构统一标识和服务化,并且发布了业界首本关于异构的白皮书《异构统一标识与服务白皮书》;2021年,提出了异构标识体系,并在CCSA成功立项异构力系列标准立项

    5.9K30编辑于 2022-04-19
  • 来自专栏边缘计算

    面向FaaS的异构调度技术(附PPT)

    图2 网络资源供给模式变革 什么是异构 什么叫“”? 通过网络来协同和纳管调度异构,构建起“云、边、端”一体的异构协同网络,从而更好的满足包括高性能计算、物联网、边缘计算、人工智能等众多场景的需求。 image.png 图3 异构满足多场景需求 什么是FaaS 的纳管和协同调度离不开云计算和云原生,在网络中采用云计算和云原生来实现“云、边、端”的统一纳管和资源调度是目前实现异构共享的主流技术手段 综上所述,围绕通过Serverless 进一步屏蔽底层异构的差异性,如何实现更好的协同和部署,以及发挥异构效能目前是新技术发展的热点领域,随着我国一体化枢纽计算中心的大规模建设和部署 2021年,中国联通网络团队在业界首次提出了异构统一标识和服务化,并且发布了业界首本关于异构的白皮书《异构统一标识与服务白皮书》;2021年,提出了异构标识体系,并在CCSA成功立项异构力系列标准立项

    1.1K40编辑于 2022-05-17
  • 来自专栏腾讯专有云

    直播预告:TCS异构管理与成本优化

    7月1日15:00-15:50,研修营第三期课程《国产适配:异构管理与成本优化》强势来袭。 课程亮点: ✅ 智能调度,适配工业复杂需求 ✅ 国产适配,突破采购限制,缩短部署周期 该课程基于云原生AI架构,全面覆盖资源整合、智能调度策略、国产芯片适配全流程,以统一管理平台、标准化适配框架 、场景化调度算法为核心,为企业打造“高可用、低损耗、快部署”的异构解决方案,助力企业“资源粗放管理”迈向“精细化成本控制”,深度破解异构适配及成本优化难题。 这个夏天,让您的企业告别“瓶颈”,用云原生AI驱动国产化、调度智能化,让知识产生价值,让智能触手可及!

    10400编辑于 2025-06-28
  • 来自专栏大语言模型,算力共享

    OpenStack;异构网络架构;服务与交易技术;服务编排与调度技术

    ​目录OpenStack一、OpenStack概述二、OpenStack的主要组件及功能三、OpenStack的架构四、OpenStack的应用场景异构网络架构服务与交易技术服务编排与调度技术OpenStack openstack/horizon: OpenStack Dashboard (Horizon) - horizon - OpenDev: Free Software Needs Free Tools异构网络架构对于异构资源 泛在资源的统一建模度量是调度的基础。针对泛在的资源,通 过模型函数将不同类型的资源映射到统一的量纲维度,形成业务层可理解、 可阅读的零散资源池。 将业务运 行所需的需求按照一定分级标准划分为多个等级,这样可为提供者设计 业务套餐时进行参考,也可作为平台设计者在设计算平台时根据所需运行 的业务对平台的选型涉及提供依据。 结合 OpenStack 的底层基础设施层的资源调度管理能力,对于数据中心内的异构计算资源、存储资源和网络资源可以进行有效管理。

    1.3K10编辑于 2024-08-03
  • 来自专栏软硬件融合

    异构计算:大芯片的未来

    宏观要求芯片能够支撑大规模部署。宏观与单位芯片,以及芯片的落地规模成正比。但各类性能提升的方案会损失可编程灵活性,使得芯片难以实现大规模部署,从而进一步影响宏观的增长。 但受限于CPU的性能瓶颈,以及对需求的持续不断上升,(站在视角)CPU逐渐成为了非主流的芯片。 CPU+xPU的异构计算,由于主要是由xPU完成,因此,xPU的性能/灵活性特征,决定了整个异构计算的性能、灵活性特征: CPU+GPU的异构计算。 5 未来,所有的大芯片都是超异构芯片 Intel高级副总裁兼加速计算系统和图形部门负责人Raja Koduri表示:要想实现《雪崩》和《头号玩家》中天马行空的体验,需将现在的至少再提升1000 未来,唯有超异构计算,才能保证数量级提升的同时,不损失灵活可编程性。才能够真正实现宏观的数量级提升,才能够更好的支撑数字经济社会发展。

    1.8K30编辑于 2022-12-16
  • 来自专栏气象学家

    JAMES:面向异构的高性能非静力动力框架LMARSpy

    高分辨率非静力模式面临三大核心挑战:第一,模式在不连续区域中容易出现非物理振荡,影响模拟的真实性;第二,能精细刻画垂直运动的非静力模式,其时间积分步长受限于垂直CFL条件,导致计算效率受制明显;第三,随着GPU为代表的异构的爆发式增长 ,异构计算已成为高性能计算(HPC)的核心发展方向,然而气象模式对异构的适配不足。 图3:左图为将二维的Robert连续热泡实验拓展到三维的模拟结果,以此来进行大规模网格的异构计算扩展性测试。 为增强异构的可移植性,LMARSpy采用Python语言开发,模式和并行框架代码与高性能计算后端分离,可灵活切换不同计算后端(如PyTorch等)。 该研究还通过即时编译技术(JIT)让代码的运行速度接近机器码水平,实现异构计算机的高性能计算。

    15510编辑于 2026-03-25
  • 来自专栏软硬件融合

    异构 x Chiplet:双剑合璧,实现指数级提升

    另一方面,超异构带来的指数级提升,使得Chiplet的价值得到更加充分的发挥,反过来会促进Chiplet的大范围流行。 UCIe能够满足几乎所有计算领域,包括云端、边缘端、企业、5G、汽车、高性能计算和移动设备等,对、内存、存储和互连不断增长的需求。 +xPU的多个异构系统的集成。 3.3 Chiplet和超异构的关系:双剑合璧,相互成就 超异构计算和Chiplet技术是相互协同、相互成就的关系: 系统越大,设计规模越大,超异构的性能优势就越明显。 超异构计算的价值得到充分体现,超异构不断落地,会带动Chiplet的价值发挥、更广泛的落地以及市场繁荣。 随着超异构的发展,对Chiplet的要求会不断提高,需要Chiplet技术向更高的能力迈进。

    53640编辑于 2022-12-16
  • 金融智演进:基于异构与推理加速的国产GPU全栈落地路径

    数据来源: 腾讯全球数字生态大会城市峰会,主讲人罗方华(浪潮集团) 一、 应对封锁与推理时代的双重挑战 金融行业正面临从“模型训练”向“大规模推理”转型的战略拐点,同时叠加外部供应链限制,导致基础设施建设面临多重瓶颈 规模门槛高: LO级预训练及L1级行业大模型训练需千卡级规模,中小客户难以独立支撑超节点方案建设。 二、 构建异构纳管与全栈推理服务 针对金融行业的复杂需求,通过“基建+平台+网关”的三层架构提供解决方案: 异构底座: 针对2026年国产GPU发展(预测显存带宽达HBM3E、支持FP8/FP4 四、 某银行国产替代与业务落地 客户背景: XX银行 实施规模: 已部署近500张沐曦C500 GPU,扩容建设国产推理算池。 五、 技术领先性与生态展望 全场景兼容: 实现传统AI(英伟达+国产)全场景覆盖,支持从OCR、客服到生物识别的多样化需求,提供从LSTM模型到FP32单精度矢量的完整支持。

    16210编辑于 2026-06-01
  • 来自专栏深度学习与python

    新生态,透视异构计算的机会和挑战 | Q推荐

    作者 | 万佳   助推经济增长,成为数字经济发展新引擎。 中国信通院发布的《中国发展指数白皮书》表明,在中每投入 1 元,将带动 3-4 元经济产出。发展指数每提高 1 点,GDP 增长约 1293 亿元。 虽然变得愈加重要,但是其发展却面临供需矛盾问题。一方面,对的需求增长迅猛。 简言之,遇到瓶颈,并且成为摆在企业和行业面前的难题。 1 异构计算 脱颖而出 如何解决算瓶颈问题,业界提出了各种解决思路和方法,其中,异构计算从中逐渐脱颖而出,备受企业和行业期待。 相比传统的单一计算架构,异构计算不仅可以提高和性能,降低功耗和成本,而且还具备多类型任务的处理能力,发展潜力巨大。

    82910编辑于 2023-03-29
  • 来自专栏光芯前沿

    异构集成技术与人工智能:从挑战到系统级创新

    一、AI 需求的指数级增长与摩尔定律的困境 人工智能的快速发展以计算能力的爆炸式需求为显著特征。 自 2012 年以来,AI 训练所需的浮点运算次数(FLOPs)呈现出远超摩尔定律的增长速率 —— 传统半导体工艺遵循每两年性能翻倍的规律,而 AI 模型的训练需求每两年增长达 750 倍。 以 GPT-3 为例,其 1750 亿参数的训练需要 1 万亿次浮点运算,若采用英伟达 FP16 张量核心 GPU(单卡 312 TFLOPS),需 4000 卡集群持续运行 1 个月,总功耗达 1600 AI 时代的需求已从 “单芯片性能优化” 转向 “多组件协同集成”,异构集成(Heterogeneous Integration, HI)成为突破瓶颈的核心路径。 从密度提升到能效优化,从硬件架构创新到设计工具革命,HI 正推动 AI 计算从 “单一器件优化” 转向 “全系统协同”。

    1.1K10编辑于 2025-04-27
  • 来自专栏产品经理的人工智能学习库

    – computation

    文章目录 人工智能里的是什么? 在普通电脑中,CPU就提供了帮助电脑快速运行。玩游戏的时候需要显卡提供,帮助电脑快速处理图形。 而在 人工智能中,需要有类似CPU和GPU的硬件来提供,帮助算法快速运算出结果。 之前在算法里讲过,在制造木桌的过程中,工厂的流水线就是算法。 在那个例子中,工厂中的机器就像,机器越好越先进,制造的过程就越快。 ? 越大,速度越快 维基百科版本 Techpedia版本 是使用计算机技术完成给定目标导向任务的过程。 可以包括软件和硬件系统的设计和开发,用于广泛的目的 – 通常构建,处理和管理任何类型的信息 – 以帮助追求科学研究,制作智能系统,以及创建和使用不同的媒体娱乐和交流。 查看详情 维基百科版本 是使用计算机的任何活动。它包括开发硬件 和软件,以及使用计算机来管理和处理信息,进行交流和娱乐。是现代工业技术的一个至关重要的组成部分。

    2.7K30发布于 2019-12-18
  • 来自专栏TEG云端专业号的专栏

    沉吟至今,生而为云 :异构FPGA在云端一次的升华

    深度定制与革命:相比于增加服务器数量和集群规模,另一种增加计算能力的方式是提升每台服务器的性能,于是,异构的计算方式成为提升的利器。当前处理器可根据通用性和定制性的差异总结为下图。 当某一类型的计算形成一定规模,高、低功耗为代表的专用 ASIC 便成为一种极致下的选择,如:Google的TPU。然而 FPGA 却是一种例外。 另一方面,FPGA的可编程特性可以加载不同的运算架构,实现器件本身的通用性,不但可以设计针对图像图像的计算结构,也可实现GPU并不擅长的搜索、加密解密等计算结构,因此成为CPU的黄金搭档,为每个计算节点实现的全面升级 当采用GPU提升时,GPU的计算数据需要分享服务器的网络带宽、PCIE带宽、内存带宽等,影响计算效率的同时反而加剧了服务器的带宽瓶颈。 特定领域需求的多样性和对需求的增加,使异构化的云服务成为一种趋势,FPGA因其灵活性和对众多非标准计算构架的支持,受到了越来越多的公司的关注,学术界关于对虚拟化FPGA资源的高效利用也走进人们的视野

    2.6K31发布于 2017-07-03
  • 来自专栏科技云报道

    之后,“存”上位

    芯片的摩尔定律逐渐逼近物理极限,存开始从幕后走向台前,成为AI领域下一个关键赛点。 长期以来,伴随企业数字化转型所建设的“烟囱式”AI基础设施各自为战,数据奔流,价值却困于“堰塞湖”。 存中心作为新型的数据基础设施,正成为AI时代数据流通和融合应用的破题关键。 AI时代的 “数据决定论” AI技术的发展离不开三大要素:数据、算法和。 在训练方面,高性能并行文件系统可以提升大模型训练效率,超大带宽和容量支持超万卡集群无瓶颈扩展,EB级扩展能力适应海量数据,加速卡直通技术使数据从存储到“一跳直达”。 构建AI时代新型 “数据粮仓” 与聚焦在“”不同,数据存聚焦在“数”和“存”,是数据生产要素处理的综合能力体现,肩负着为数字经济各种场景提供源源不断的“生产资料”的使命。 将目光投向更长远,新型AI存储很可能是撬动人工智能时代杠杆的另一个支点,“以存强”“以数助”亦是弯道超车的重要落点。当AI产业具备扎实的存底座,才能登高远眺,看见AI时代最美的风景。

    49300编辑于 2025-06-19
  • 来自专栏大语言模型,算力共享

    共享:环形结构的分配策略

    ​目录共享:环形结构的分配策略方法签名方法实现注意事项nodes.sort(key=lambda x: (x[1].memory, x[0]), reverse=True)end = round (start + (node[1].memory / total_memory), 5)共享:环形结构的分配策略这段代码定义了一个名为RingMemoryWeightedPartitioningStrategy

    1.2K20编辑于 2024-07-26
  • 来自专栏科技云报道

    更要“利”,“精装”触发大模型产业新变局?

    面对如此巨大的需求,企业如何在平衡与能耗开支的前提下,高效地利用和管理算资源,是实现降本增效的重要命题。这其中,对基础设施和软件平台的精细化运营管理成为破题的关键。 大模型对的需求是显而易见的,但更关键的点可能在于能否把更高效地挖掘出来。在不同的阶段,企业对于需求也不尽相同。 《中国发展观察报告》显示,有些中心整体利用率不足30%,大量的资源在沉睡中等待被唤醒,供需矛盾凸显。 这种演进使智能变得不可或缺,且不再局限于简单的叠加或升级,而是在多元重构驱动下实现的极致拓展与跃迁。 所谓“精装”,就是依托宁畅定制化与全栈全液能力,以栈为交付形态,从用户需求与体验出发,提供全体系软硬协同的精细化服务。

    1K00编辑于 2025-03-04
  • 来自专栏ADAS性能优化

    生存VS

    英國「金融時報」報導,鑒於美國近期祭出制裁來壓制中國電腦運能力,中國科技企業阿里巴巴和壁仞科技為了避免受制裁,正將各自最先進晶片的設計微調,以降低運處理速度。 華府10月宣布的制裁措施,禁止任何運能力超過一定門檻的半導體產品出貨至中國除非得到许可。這打亂了上述中國科技企業的發展計畫。 但中國工程師表示,要判斷哪些晶片產品不受制裁並不簡單,因為華府對於如何計這個速率沒有清楚規範。 根據研究集團伯恩斯坦(Bernstein)計,從壁仞官方網站存檔紀錄來看,在美國宣布制裁之前,壁仞首款處理器BR100的規格算出傳輸率是640 GB/s,超過限制門檻;但根據壁仞官網目前發布的BR100

    1.3K20编辑于 2022-12-20
  • 来自专栏运维开发王义杰

    函数计算

    对于一个函数消耗的,我们通常用它的运行时间来衡量,例如在基准测试中。你可以测量一个函数运行一次(或者多次)所需要的时间,然后用这个时间来比较不同函数或者同一个函数的不同实现。 然而,这种方法并不能直接测量一个函数消耗的CPU。为了获得这种信息,你可能需要使用一种叫做CPU profiling的技术,它可以测量程序在CPU上花费的时间。Go的pprof包提供了这种功能。

    78410编辑于 2023-08-16
  • 腾讯云异构赋能保险行业AI落地:从部署实践到效能提升

    剖析保险行业AI应用的战略瓶颈 保险行业AI应用覆盖AIGC(精准营销、数字营销员、文本摘要、智能助手)、传统AI(CV人脸核身/图像定损、NLP风险评估/保单管理、OCR/ASR证件识别)等多场景 部署与运维复杂:需自行选型GPU型号、部署驱动/CUDA环境、配置云硬盘带宽,存在不匹配风险,运维门槛高; 国产化与适配挑战:需满足信创要求,但主流大模型(如Qwen3-32B、chatglm4-9B)与国产适配难度大 undefined(来源:CSIG云与智慧产业事业群) 构建异构全栈解决方案 腾讯云基于“一云多芯”智方案,提供软硬一体高性能服务,核心组件包括: 自研紫霄V2(PTX2实例):单卡48GB qGPU共享:业界唯一支持在离线混部,/显存精细隔离(兼容T4/A10/V100/L20等),部署密度提升20%,千卡扩展比达95%(来源:CSIG云与智慧产业事业群)。 量化异构部署的业务效能 核心业务指标(数据均源自CSIG云与智慧产业事业群): 成本优化:紫霄V2推理业务性价比提升20%~50%;qGPU通过共享降低资源成本。

    32210编辑于 2026-05-01
  • 来自专栏大规模集群

    大规模异构集群,混合并行分布式系统,解释不均衡问题HETHUB

    2) 不均衡的分布式训练挑战。为异构集群中的大规模模型设计和实现最优的分布式训练策略非常困难。 三、不均衡非均匀拆分策略针对异构,不均衡,模型拆分的基本思路3.1 基于流水线并行的非均匀拆分策略在大语言模型的训练中,采用基于流水线并行的异构训练方案,通过非均匀拆分transformer 可以根据各芯片的实际,让较高的芯片处理更多的层,较低的芯片处理更少的层,从模型结构角度,每层的计算量是一致的,所以按比作为层拆分比例可以达到最好的效果。 3.2 基于数据并行的异构训练基于数据并行的异构训练,同样可通过调整不同芯片上的数据批处理规模,来应对差异。 四、异构模型自动拆分过程根据模型拆分的基本思路,构建检索空间,检索出模型最终拆分方式。

    76810编辑于 2024-09-30
领券