首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏LET

    GPGPU简介

    GPGPU编程 目前,我所了解的主要有三种,Compute Shader,CUDA和OpenCL,这个是个人的优先级。在编程角度,思想上都大同小异。 其次,作为运算的参数和结果,我们尽可能减少内存和显存之间的转换,比如我们计算创建一张纹理(GPU),getBits(RAM),然后OpenGL渲染(GPU),在这种场景下,如果在GPGPU中的纹理能够直接对应 GPGPU的应用 首先,大规模的计算,比如CNN神经网络或者挖矿,这类应用最适合GPU,没有太多技术难点,就是怕GPU闲着,堪称GPU的996。

    2.7K20发布于 2019-05-10
  • CUDA 线程ID 计算方式;NVIDIA GPGPU

    thread ID 的计算方式,简单来说很像小学学的除法公式,本文转载自同学一篇博客;并进行简单修改;

    2.2K10发布于 2021-02-26
  • 来自专栏陌上风骑驴看IC

    GPGPU: C记 RTL 到Signoff 流程全解密

    2021 CadenceCONNECT:异构计算设计——GPGPU完整解决方案 ? 关键字:GPGPU 预测布局 Glitch Power OCV 概要 1 Overview of GPU 在谈论 GPGPU 之前,我们先聊下 GPU。 1.2 GPGPU 发展及未来趋势 近年来,在摩尔定律严谨的放缓和 GPU 在通用计算领域高速发展的此消彼长之下,通用图形处理器(GPGPU)逐渐反客为主,将应用范围扩展到图形之外,无论是科研教育、财务计算 GPGPU 拥有较强的优势,第一,GPGPU 提供了多个并行计算的基础结构,可以执行海量数据的并行计算;第二,GPGPU 拥有更高的访存速度;第三,GPGPU 拥有更高的浮点运算能力。 3 Cadence GPGPU 解决方案 从 GPGPU 未来趋势和眼下所面临的挑战出发,Cadence 提供了从 RTL 到 Signoff 的一系列完整的解决方案,每套解决方案,都从全局出发,在解决每项挑战的情况下

    2.9K40发布于 2021-07-20
  • 2025年国内外12家GPGPU产品大盘点

    ,而近年来随着HPC、人工智能、云的发展,GPGPU的市场规模也在进一步扩大。 今天就让我来带大家了解一下这些国内外厂家的GPGPU产品吧。 近日,芯原发布了GPGPU-AI计算IP是面向高性能AI计算的产品。 但它做的并不是传统意义上的GPGPU,而是带能画又能算的带AI外挂的渲染GPU。 同样,它的赛道也不是GPGPU,而是低功耗AI推理加速卡和边缘AI加速卡。 11.海光 海光的DCU(Deep Computing Unit)虽然名字不是GPGPU,但它确实属于GPGPU

    2.9K10编辑于 2025-08-01
  • 天数智芯赴港IPO:累计出货5.2万片,拿下9.8%国产GPGPU市场!

    2025年12月19日,作为中国首家通用GPU(GPGPU)企业,上海天数智芯半导体股份有限公司(以下简称“天数智芯”)正式通过了港交所的上市聆讯,距离登陆港股市场仅一步之遥。 需要强调的是,这里的统计口径是通用GPU,即面向AI应用的GPGPU,因此目前主要产品为GPU显卡的摩尔线程、以及AI芯片是基于ASIC的华为和寒武纪并未归入该统计。

    55310编辑于 2026-03-20
  • 龙芯首款GPGPU芯片9A1000研发完成,三季度内交付流片

    国产处理器厂商龙芯中科于9月15日在互动平台回复称,龙芯首款 GPGPU 芯片 9A1000 的研发基本完成,三季度内会交付流片。成功与否需待流片回来后的测试结果。 9A1000是龙芯中科今年6月正式披露的首款GPGPU芯片,其定位是低成本的GPGPU,这也是龙芯中科首款GPGPU专用芯片,主要面向显卡/AI加速卡。 龙芯中科首席工程师、通用GPU处理器研发负责人苏孟豪则进一步指出,9A1000相比2K3000集成的第二代GPGPU核心LG200带来了5倍以上的性能提升,AI算力更是达到了40TOPS。 龙芯中科董事长胡伟武还透露,后续的9A3000则是一款更高性能的GPGPU,如果采用先进的Xnm工艺,性能可能会带来3-5倍的提升。 编辑:芯智讯-浪客剑

    34510编辑于 2026-03-20
  • 来自专栏Fish

    在docker里跑gpgpusim

    使用gpgpusim官方vbox虚拟机 gpgpusim官方提供了vbox虚拟机文件的下载,大概7G多, http://ece.ubc.ca/~taylerh/files/gpgpu-sim/gpgpu-sim.vm.tar.gz 在该目录下建立libsim,将vbox虚拟机里编译好的/home/gpgpu-sim/gpgpu-sim_distribution/lib/gcc-4.6.4/cuda-4020/release/libcudart.so 新建目录/home/find/e/gpgpusim/cuda/,将vbox虚拟机里/home/gpgpu-sim/cuda/toolkit/4.2/cuda/bin文件夹拷贝到这里,即/home/find 运行 以vectoradd为例,在host的gpgpusim文件夹下建立test文件夹,并拷贝vectoradd.cu文件以及gpgpusim提供的配置文件(在/home/gpgpu-sim/gpgpu-sim_distribution

    1.5K30发布于 2019-05-28
  • 来自专栏xingoo, 一个梦想做发明家的程序员

    CUDA入门

    CUDA API包括三个,从低到高等级分别为 Thrust API  Runtime API   Driver API 用于CUDA的GPU是安装于主机系统中的独立设备 GPGPU运行在一个和主处理器相隔离的存储空间中 CUDA Kernel是可在主机代码中调用而在CUDA设备上运行的子程序(Kernel没有返回值) Kernel的调用时异步的,即主机仅仅把要执行的Kernel顺序提交给GPGPU,并不等待执行完成, 使主机进入阻塞状态   cudaMemory() 实现阻塞式数据传输 GPU上的基本运行单位是线程 GPU上最大的可共享的内存区域成为全局内存   常量内存、高速缓存、共享内存、局域内存、纹理内存、寄存器 GPGPU 编程的三条法则   1 将数据放入病始终存储于GPGPU     pcie总线速度大概是8gb/s,而GPU全局内存的速度大概是160-200gb/s   2 交给GPGPU足够多的任务     传输数据还要消耗时间 ,因此,最好让GPU工作时间能补偿传输所浪费的资源   3 注重GPGPU上的数据重用,以避免带宽限制     尽量重用数据以获取高性能 回归测试:经常用一段代码作为回归测试,测试kernel函数的正确性

    81291发布于 2018-01-17
  • 港股“GPU第一股”来了!壁仞科技暴涨118%,市值突破1000亿港元!

    一、专注于GPGPU芯片及解决方案研发 根据招股书显示,壁仞科技成立于2019年,专注于开发GPGPU芯片及基于GPGPU的智能计算解决方案以提供AI所需的基础算力。 自2019年以来,壁仞科技已开发出第一代GPGPU架构,并已成功开发两款芯片,即BR106及BR110,并开发了一系列基于GPGPU的硬件。 公司的GPGPU芯片是基于GPGPU的硬件的关键组件,其被集成到行业标准硬件形态规格中,如PCIe板卡及OAM。 公司基于GPGPU的硬件使用公司自主开发的软件平台BIRENSUPA运行。其乃搭建于公司GPGPU之上的软件栈,用于开发人工智能应用程序。 洪洲先生负责监督及制定公司的产品技术发展方向,亦是公司GPGPU芯片的首席架构师,负责GPGPU架构的定义和设计。

    34910编辑于 2026-03-20
  • 来自专栏Dance with GenAI

    AI如何变革软件和硬件开发的范式?

    解决方案需借鉴GPGPU 架构,结合开源技术与开放标准,通过协作创新避免供应商锁定,实现硬件可编程性与可持续扩展,最终降低功耗、延长硬件生命周期并提升投资效率。 三、软件定义硬件(SDH)与 GPGPU 架构的应用 SDH 核心设计原则 保留传统编程模型,减少软件迁移成本(如兼容现有代码库)。 GPGPU 的适配性 针对 AI 工作负载的高并行、多线程特性设计,支撑前沿研究(如当前 90% 的 AI 模型开发基于 GPGPU)。 五、未来就绪的硬件策略 设计目标:开发支持开源生态的可编程 GPGPU 架构,平衡当前效率与未来适应性。 优先选择参与开源社区的供应商,以实现: 投资优化:硬件可随软件升级延长使用周期。

    47010编辑于 2025-06-17
  • 壁仞冲刺“港股GPU第一股”:三年半研发超33亿!

    一、专注于GPGPU芯片及解决方案研发 根据招股书显示,壁仞科技成立于2019年,专注于开发GPGPU芯片及基于GPGPU的智能计算解决方案以提供AI所需的基础算力。 自2019年以来,壁仞科技已开发出第一代GPGPU架构,并已成功开发两款芯片,即BR106及BR110,并开发了一系列基于GPGPU的硬件。 公司的GPGPU芯片是基于GPGPU的硬件的关键组件,其被集成到行业标准硬件形态规格中,如PCIe板卡及OAM。 公司基于GPGPU的硬件使用公司自主开发的软件平台BIRENSUPA运行。其乃搭建于公司GPGPU之上的软件栈,用于开发人工智能应用程序。 洪洲先生负责监督及制定公司的产品技术发展方向,亦是公司GPGPU芯片的首席架构师,负责GPGPU架构的定义和设计。

    30910编辑于 2026-03-20
  • 来自专栏数字芯片

    浅谈国产GPU发展

    从开发人员团队数量来看,GPGPU如需要200人的硬件团队,渲染GPU可能要再增加50人,但软件开发人员相比GPGPU或需增加三倍,需要更多的人员开发驱动和编译器等。”杨建说。 “芯动科技目前聚焦于渲染GPU领域,但GPGPU也在规划之中,芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然GPGPU的价值很高,增长也不错,但图形渲染GPU在细分市场总的体量更大。” 因此,沐曦采取先做GPGPU,再发展图形渲染GPU的模式。在自研GPGPU中,只有统一着色器IP,不需要固定渲染流水线,这样可以在自研GPU的道路上一步一个脚印稳健前行。 而在GPGPU领域,几乎是被英伟达一手打造的CUDA生态所垄断。“GPGPU的生态非常复杂,要求一路打通到应用层,提供面向所有应用的全面支持,甚至要自主开发以支持一个新的应用领域。”杨建指出。 杨建则表示,在GPGPU方面,英伟达没有百分百的优势,国内GPGPU在某些方面可以说是超越的。国内厂商在HPC和服务器、通用计算等领域可以依托Linux的开放性和可控性强的优势,实现有效突破。

    2.2K31编辑于 2022-09-19
  • 来自专栏芯智讯

    龙芯3C6000芯片初样已回片:测试符合预期,将于四季度发布!

    这也为龙芯后续的CPU与CPU互联、CPU与GPGPU互联、GPGPUGPGPU互联提供高速缓存一致性协议传输。 基于此,龙芯3C5000也可以通过龙链技术实现片间高速互联,可以实现双硅片 32 核 64 线程、四硅片 64 核 128 线程,并且支持 GPGPU、各类加速器扩展。 编辑:芯智讯-浪客剑

    30110编辑于 2024-07-02
  • 全新GPGPU芯片曝光!

    龙芯GPGPU芯片9A1000和9A2000曝光 “凡是做GPU的企业都必须要有自己的GPU。” 苏孟豪指出,龙芯中科从GPU转型到GPGPU的难度不亚于从第一代的从零起步,花了三年时间才推出了第一版设计。 根据胡伟武的披露的龙芯中科GPGPU架构资料显示,其每个GPGPU硅片当中包含了X个GPC计算单元,通过多层次互联;每个GPC当中则将集成1个GP单元(Graphics Pipeline, 16pixel 随着第二代GPGPU核心LG200的成功商用,龙芯中科也开展了专用GPGPU芯片9A1000和9A2000的研发。 龙芯中科对于9A1000的定位是低成本的GPGPU,这也是龙芯中科首款GPGPU专用芯片,主要面向显卡/AI加速卡。

    82510编辑于 2026-03-19
  • 来自专栏帅云霓的技术小屋

    大模型与AI底层技术揭秘 (3) 圆周率里的奥秘

    Geforce256 这一代GPU,相对于以Voodoo、TNT为代表的专用图形GPU,最大的改进就是,使用具有通用计算(加减乘除)能力的计算单元,代替专用的三角形计算引擎,并在指令层级实现通用计算的能力,也就是所谓的GPGPU GPGPU的实现,我们可以理解为,首先将CPU极度简化,精简掉其中大部分内存管理、IO、中断与异常处理等控制指令,仅保留大大简化的ALU(Arithmetic and Logic Unit)及所必须的控制电路 ,并为其提供适合并发运算的寄存器,作为GPGPU的基本运算单元。 与图形GPU相比,GPGPU甚至有可能精简掉大部分图形专用的功能,如光影追踪计算单元和渲染单元,甚至把连接显示器的接口都精简到,使其成为纯粹的异构计算单元,用于提供算力。

    64440编辑于 2023-10-08
  • [C#]C#最简单方法获取GPU显存真实大小

    一种方法是使用cudafy.NET这个库 GPGPU gpu = CudafyHost.GetDevice(CudafyModes.Target, CudafyModes.DeviceId); var Console.WriteLine(p); 源码:GitHub - lepoco/CUDAfy.NET: CUDAfy .NET allows easy development of high performance GPGPU

    30300编辑于 2025-07-20
  • 来自专栏AI科技评论

    业界丨格灵深瞳 CEO 赵勇亲自撰文:Nvidia 成功背后的远见与坚持

    可以这么说,如果没有GPGPU,坚持研究了二十多年神经网络算法的Yann LeCun和Hinton教授们,恐怕还得继续在学术界被继续埋不少年。 从此以后我就认定了GPGPU是人工智能的重要解决方案,我的科研人生就此走上了康庄大道。 EPSON的实习结束后,我申请了Nvidia Research lab的实习生,希望深入研究一下GPGPU在计算机视觉信号处理中的应用。 今天,格灵深瞳的所有产品(硬件部分)都采用了Nvidia的GPGPU处理器。 有人说是深度学习技术成全了NV的GPGPU,要不然NV这么多年对科学运算大规模的投入可能就打水漂了。其实我认为,反而是GPGPU技术,成全了深度学习技术。

    1.3K70发布于 2018-03-09
  • 来自专栏程序员叨叨叨

    1.3 国内外研究现状

    近年来,基于GPU进行通用计算的研究逐渐成为热点,被称之为GPGPU (General-Purpose Computing on Graphics Processing Units,也被称为GPGP,或 关于GPGPU的更多知 识点可以参阅网站http://gpgpu.org/。 旨在降低 GPU 编程难度,设计基于 GPU 的高级程序语言的研究同样进行的如火如荼。

    1.3K20发布于 2018-08-28
  • 来自专栏Rust语言学习交流

    【Rust 日报】2021-11-07 rsqlite3:Rust版sqlite3

    output directory for downloads GitHub:https://github.com/agourlay/dlm gpgpu-rs :基于wgpu的GPU计算库 向量 A B 相乘并将结果存入 C 的例子: use gpgpu::*; fn main() -> GpuResult<()> { let fw = Framework (a.pow(2), b); } Ok(()) } GitHub:https://github.com/UpsettingBoy/gpgpu-rs From 日报小组 长琴 社区学习交流平台订阅

    67740发布于 2021-11-12
  • 来自专栏张善友的专栏

    并行计算Brahma :LINQ-to-GPU

    也就是说Brahma是一个并行计算(重点放在GPGPU )的框架,使用LINQ进行流转换工作(LINQ-to-streaming computation 或者 LINQ-to-GPU)。 现在也可以在Mono上运行 注: 通用图形处理器(英語:General-purpose computing on graphics processing units,簡稱GPGPU或GP²U)是一种使用处理图形任务的专业图形处理器来从事原本由中央处理器处理的通用计算任务

    1.6K50发布于 2018-01-22
领券