首页
学习
活动
专区
圈层
工具
发布

#nvidia

AI早报 | 6月4日:Qwen3.7 Plus 前日上线,Anthropic 公开 Claude 安全机制,NVIDIA Cosmos 3 开启物理AI新纪元

小博测试成长之路

6月2日,阿里云通义千问团队发布 Qwen3.7 Plus,距 Qwen3.7 Max(5月21日)仅 12 天,这是全球大模型厂商中罕见的双周级更新节奏。

100

理性解析NVIDIA RTX Spark真实实力、差异与适用场景全盘梳理

GPUS Lady

在台北 Computex 2026大展上,NVIDIA 由黄仁勋亲自揭晓的RTX Spark 超级芯片(Superchip),无疑是本届展会最大重磅亮点。对于硬...

1.4K30

生成式AI驱动娱乐社交应用增长,腾讯云携NVIDIA推全栈方案

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

生成式AI驱动娱乐社交应用增长,腾讯云携手NVIDIA提供全栈解决方案 行业面临内容创作效率与用户互动体验的双重瓶颈 全球娱乐与社交应用市场增长迅猛,但竞争加剧...

11510

单季752亿美元,毛利率78%:NVIDIA正在成为AI时代的标准石油

老周聊架构

而且这只是它的数据中心业务收入——还不算游戏、汽车、专业可视化。整体营收同比增长 85%,相当于每天进账超过 3 亿美元。

13210

黄仁勋痛批“裁员赖AI”:过于懒惰且毫无道理!

芯智讯

随着人工智能(AI)技术的快速发展,全球众多企业自去年以来纷纷启动裁员,外界也将此归咎于AI的导入。然而,英伟达(Nvidia)CEO黄仁勋日前接受媒体专访时强...

12510

一文分清 NVIDIA 三大专家认证AII/AIO/AIN,拿捏 AI 基建时代职场红利

GPUS Lady

当前算力基建已是 AI 领域核心风口,国内2026年度投资规模预估将突破 1.5 万亿元,行业预测未来五年的复合年均增长率保守超 40%,至2030年将超过5万...

23110

Elasticsearch 向量索引速度提升 12 倍:在 GPU 和 CPU 层部署 NVIDIA cuVS

点火三周

NVIDIA cuVS 在 GPU 上构建 HNSW 图,使 Elasticsearch 中的向量索引速度最高提升 12 倍。本文将介绍两种生产部署模式:模式 ...

11410

使用NVIDIA AI-Q和LangChain构建企业搜索深度代理

用户11764306

作者: Sean Lopp, Sam Pastoriza, Ajay Thorve, Chantal D Gama Rose, Victor Moreira

13110

收藏!NVIDIA NemoClaw 10 大高频问题一次性讲清

GPUS Lady

以下是基于 NVIDIA NemoClaw GitHub Discussions 页面内容梳理的通用 Q&A(以下覆盖该仓库核心方向及高频潜在问题,结合社区常见...

7510

314| Nvidia AI工厂:重塑企业计算的底层逻辑

数据存储前沿技术

在摩尔定律放缓与算力需求爆炸的矛盾下,企业计算正经历一场范式转移。Nvidia 正在构建的“AI工厂”不仅是 GPU 的堆叠,更是一套旨在吸收传统 x86 架构...

24710

轻量 GPU 测试机 vLLM 镜像拉取失败排查记录

goodgood_live

记录一个小问题:我在一台轻量 GPU 测试机上复现 vLLM 服务,docker compose up -d 没有进入业务启动阶段,镜像下载先超时了。

11100

智能体部署再升级:NVIDIA NemoClaw 开始支持 Hermes

GPUS Lady

近日,NVIDIA 官方文档更新显示,其面向 OpenClaw 生态的开源安全部署栈 NemoClaw 已新增对 Hermes 智能体 的实验性支持,开发者可一...

25910

NVIDIA 开源 cuda‑oxide:纯 Rust 编写 CUDA 内核

GPUS Lady

NVIDIA终于可以公开过去半年 潜心研发的重磅成果 —— 正式开源了cuda‑oxide。这是一款实验性定制 rustc 编译器后端,最大亮点是可以用纯 Ru...

19310

Nvidia STX:从计算优化到数据路径控制,存储系统的架构重构

数据存储前沿技术

当AI工作负载从训练阶段转向推理阶段时,一个被长期忽视的瓶颈正在浮出水面——存储不再是被动的数据保管库,而是推理性能的决定性因素。

18710

中国芯片距离英伟达还有多远?

鱼片粥来碗豆腐

到了 2026 年的今天,站在这个节点回望,我感触最深的一点是:中国芯片与英伟达的差距,已经从过去那种“全方位的降维打击”,演变成了如今“局部突围、整体博弈、生...

31100

打破刻板印象:JAX 早已全面适配 NVIDIA GPU,轻松微调 Llama 3.1

GPUS Lady

在大模型高速发展的当下,PyTorch、TensorFlow 是大众最熟悉的深度学习框架,但还有一款高性能科学计算与 AI 框架JAX,长期笼罩在一层认知迷雾里...

15810

DGX Spark软件优化与模型加速技术

用户11764306

AI生成摘要:2026年CES发布的DGX Spark软件更新,通过软件优化、新模型更新和开源协作,为DGX Spark及基于OEM GB10的系统带来了重大性...

35120

ZStack dGPU:让虚拟机里的 GPU 也能按需切分

ZStack云计算

在 Kubernetes 生态中,GPU 共享调度已趋于成熟——时间片轮转、显存隔离、按 Pod 粒度分配,各家方案百花齐放。

18510

解锁边缘 LLM:Jetson Orin 内存管理与优化全攻略

用户4730701

在边缘设备上跑大语言模型(LLM),内存就是一切。 OOM、卡顿、启动崩溃、性能不稳定……90% 的问题都来自对「内存生命周期」与「统一内存架构」不理解。

49810
领券