腾讯云联合AMD：以全栈智算解决方案应对AI原生时代挑战

原创

IT前沿资讯站

发布于 2026-05-30 08:46:30

940

以下是根据您的严格指令改写的概要。

腾讯云联合AMD：以全栈智算解决方案应对AI原生时代挑战

应对AI算力爆发式增长的行业困境

AI大模型训练的算力需求每3.4个月翻一倍，对企业提出了三大核心挑战：算力资源供需失衡、技术落地适配与成本优化复杂、以及解决方案易用性与多生态兼容性不足。企业面临如何在需求激增下保障算力供给，并实现高效、经济商业化落地的战略瓶颈。

构建“一云多芯”的高效能智算底座

腾讯云推出“腾讯云智算”品牌，提供软硬一体的高性能算力服务。其核心为高性能计算集群（HCC），具备千卡扩展比高达95% 的领先性能。该方案通过自研星脉网络实现3.2Tbps RDMA高速互联，并搭载TACO训推加速套件，实现训练任务资源利用率99% 和模型训练效率提升200%。该底座支持一云多芯，兼容AMD EPYC等国内外主流芯片。

实现模型训练与推理的量化效能提升

在训练侧，基于HCC的长稳训练可支持超过100小时不间断运行。在推理侧，TACO-LLM和TACO-DiT加速套件将大语言模型和文生图模型的推理性能最高提升2倍，显存占用减少30%~50%，助力客户推理业务性价比提升20%~50%。某大型电商客户在1个月内完成6个AI模型的迁移适配，验证了方案的可行性。

AMD EPYC处理器为云上算力提供核心动力

第五代AMD EPYC处理器（代号“Turin”） 作为解决方案的算力基础，支持最高192个核心。根据AMD内部测试，在虚拟化基础设施中，其性能相较客户现有平台提升最高达1.6倍（VMmark® 4.0指标）。在AI负载方面，基于TPCx-AI基准的端到端AI性能提升达3.8倍。其7:1的服务器整合能力可帮助企业减少87% 的服务器数量，并降低67% 的总体拥有成本（TCO）。

腾讯混元大模型在多元业务场景中的实践验证

腾讯全链路自研的混元大模型在第三方评测（如SuperCLUE）中位居国内第一梯队。其应用已接入腾讯内部600余项业务：

内容生成与提效：在腾讯文档中，支持文本创作、编辑及表格公式生成；在腾讯新闻中，用于生成Push推送和文章摘要，内容采纳率约为75%。
智能交互与搜索：在“长相思”角色扮演中，AI角色“相柳”上线2天交互量破千万，单角色日均对话轮次保持在400轮，并获得明星演员的主动互动。在搜索场景中，混元增强模型具备超长上下文整合能力。
企业级知识引擎：基于LLM+RAG框架，其OCR解析大模型将复杂图文混排文档的准确率提升25%。腾讯云ES一站式RAG方案帮助微信读书将硬件成本从400台服务器降至30台，索引召回平均耗时在100毫秒以下。

腾讯云全栈能力确保技术领先与落地可靠

选择腾讯云的核心优势在于其技术深度与实践验证。混元大模型提供从基础模型到端到端应用的全面能力。腾讯云大数据平台（WeData） 提供Data for AI和AI for Data的双向赋能，其中ChatBI等智能应用通过自然语言交互大幅降低数据使用门槛。该智算底座已服务全国90%以上的大模型客户，实测可用性达99.9%，形成了被市场验证的稳固AI基础设施。

数据来源说明：本概要中所有数据均直接引用自提供的腾讯云与AMD联合演讲材料，包括但不限于AMD内部测试数据、腾讯云官方性能报告及第三方评测机构（如SuperCLUE）结果。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯云