首页
学习
活动
专区
圈层
工具
发布

英伟达推748GB显存桌面站:本地跑大模型,两月回本

英伟达正式推出DGX Station,这款专为 enterprise 级应用设计的桌面设备,正试图以强大的本地算力取代企业对云端AI订阅服务的依赖。其核心突破在于配备了748GB统一内存,并搭载最新的GB300 Grace Blackwell Ultra芯片,实现了从云端到本地的算力迁移。

打破内存瓶颈,本地驾驭千亿参数

DGX Station的性能基石是GB300 Grace Blackwell Ultra芯片,该芯片创新性地将72核ARM CPU与Blackwell Ultra GPU集成,并通过748GB统一相干内存消除了传统架构中CPU与GPU间的数据传输延迟。这种架构使得系统能够在不牺牲精度的情况下,于本地无缝运行参数高达700亿的大型AI模型。

对于更复杂的场景,该系统支持先进的模型量化技术,能够处理参数量达一万亿的超大模型。这不仅提升了处理高负荷工作负载的效率,更为重视数据隐私的行业(如医疗、金融、国防)提供了对敏感数据的完全控制权,避免了云端部署潜在的安全风险。

高昂售价背后的快速回报

DGX Station的定价区间为9万美元至10万美元,明确指向企业团队而非个人用户。尽管前期投入较高,但其成本效益显著。据测算,对于拥有大量AI工作负载的企业,相较于持续支付昂贵的云GPU服务费用,DGX Station的投资回报期(ROI)最快可在两个月内实现。

该设备主要服务于三类需求:需要私有化基础设施以保护敏感数据的组织、处理高性能计算密集型任务的团队,以及寻求降低长期云服务成本的企业。对于预算有限或需求较轻的用户,英伟达提供了售价4,000美元的DGX Spark作为替代方案,而苹果Mac Studio则构成了另一层面的竞争选择。

未来路线图:向下兼容与生态扩张

英伟达并未止步于此,其未来愿景旨在扩大AI硬件的可访问性。公司计划于2026年第四季度推出兼容Windows版本的DGX Station,通过Windows子系统(WSL)吸引更广泛的开发者群体。此外,面向消费级市场和小规模用户的RTX Spark芯片也在开发中,旨在让高性能AI能力渗透至台式机和笔记本电脑端。

随着DGX Station的落地,英伟达正重新定义本地AI计算的边界。通过提供兼具隐私安全、高性能与成本优势的解决方案,英伟达有望引领下一波本地AI技术革新,帮助企业在摆脱云依赖的同时,最大化AI运营的效率与控制力。

【星途科讯 图文丨伊贝 首发于ZAKER科技,转载请注明出处】

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OKAGZFoPcRpqWTQ5Y7yG5V_Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券