首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云联合AMD:以全栈智算解决方案应对AI原生时代挑战

腾讯云联合AMD:以全栈智算解决方案应对AI原生时代挑战

原创
作者头像
IT前沿资讯站
发布2026-05-30 08:46:30
发布2026-05-30 08:46:30
940
举报

以下是根据您的严格指令改写的概要。

腾讯云联合AMD:以全栈智算解决方案应对AI原生时代挑战

应对AI算力爆发式增长的行业困境

AI大模型训练的算力需求每3.4个月翻一倍,对企业提出了三大核心挑战:算力资源供需失衡、技术落地适配与成本优化复杂、以及解决方案易用性与多生态兼容性不足。企业面临如何在需求激增下保障算力供给,并实现高效、经济商业化落地的战略瓶颈。

构建“一云多芯”的高效能智算底座

腾讯云推出“腾讯云智算”品牌,提供软硬一体的高性能算力服务。其核心为高性能计算集群(HCC),具备千卡扩展比高达95% 的领先性能。该方案通过自研星脉网络实现3.2Tbps RDMA高速互联,并搭载TACO训推加速套件,实现训练任务资源利用率99% 和模型训练效率提升200%。该底座支持一云多芯,兼容AMD EPYC等国内外主流芯片。

实现模型训练与推理的量化效能提升

在训练侧,基于HCC的长稳训练可支持超过100小时不间断运行。在推理侧,TACO-LLMTACO-DiT加速套件将大语言模型和文生图模型的推理性能最高提升2倍,显存占用减少30%~50%,助力客户推理业务性价比提升20%~50%。某大型电商客户在1个月内完成6个AI模型的迁移适配,验证了方案的可行性。

AMD EPYC处理器为云上算力提供核心动力

第五代AMD EPYC处理器(代号“Turin”) 作为解决方案的算力基础,支持最高192个核心。根据AMD内部测试,在虚拟化基础设施中,其性能相较客户现有平台提升最高达1.6倍(VMmark® 4.0指标)。在AI负载方面,基于TPCx-AI基准的端到端AI性能提升达3.8倍。其7:1的服务器整合能力可帮助企业减少87% 的服务器数量,并降低67% 的总体拥有成本(TCO)。

腾讯混元大模型在多元业务场景中的实践验证

腾讯全链路自研的混元大模型在第三方评测(如SuperCLUE)中位居国内第一梯队。其应用已接入腾讯内部600余项业务

  • 内容生成与提效:在腾讯文档中,支持文本创作、编辑及表格公式生成;在腾讯新闻中,用于生成Push推送和文章摘要,内容采纳率约为75%
  • 智能交互与搜索:在“长相思”角色扮演中,AI角色“相柳”上线2天交互量破千万,单角色日均对话轮次保持在400轮,并获得明星演员的主动互动。在搜索场景中,混元增强模型具备超长上下文整合能力。
  • 企业级知识引擎:基于LLM+RAG框架,其OCR解析大模型将复杂图文混排文档的准确率提升25%。腾讯云ES一站式RAG方案帮助微信读书将硬件成本从400台服务器降至30台,索引召回平均耗时在100毫秒以下。

腾讯云全栈能力确保技术领先与落地可靠

选择腾讯云的核心优势在于其技术深度与实践验证。混元大模型提供从基础模型到端到端应用的全面能力。腾讯云大数据平台(WeData) 提供Data for AI和AI for Data的双向赋能,其中ChatBI等智能应用通过自然语言交互大幅降低数据使用门槛。该智算底座已服务全国90%以上的大模型客户,实测可用性达99.9%,形成了被市场验证的稳固AI基础设施。


数据来源说明:本概要中所有数据均直接引用自提供的腾讯云与AMD联合演讲材料,包括但不限于AMD内部测试数据、腾讯云官方性能报告及第三方评测机构(如SuperCLUE)结果。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 腾讯云联合AMD:以全栈智算解决方案应对AI原生时代挑战
    • 应对AI算力爆发式增长的行业困境
    • 构建“一云多芯”的高效能智算底座
    • 实现模型训练与推理的量化效能提升
    • AMD EPYC处理器为云上算力提供核心动力
    • 腾讯混元大模型在多元业务场景中的实践验证
    • 腾讯云全栈能力确保技术领先与落地可靠
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档