首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据杂货铺

    Cloudera机器学习中的NVIDIA RAPIDS

    Cloudera Data Platform上的RAPIDS预先配置了所有必需的库和依赖项,以将RAPIDS的功能带到您的项目中。 什么是RAPIDS RAPIDS将GPU计算的功能带到标准的数据科学操作中,无论是探索性数据分析、特征工程还是模型构建。 有关更多信息,请参见:< https://rapids.ai/ > RAPIDS库旨在替代常见的Python数据科学库,例如Pandas(cuDF),numpy(cuPy),sklearn(cuML)和 作为机器学习问题,这是具有表格式数据的分类任务,非常适合RAPIDS。 本教程的重点是利用RAPIDS库的机制,而不是为排行榜构建性能最佳的模型。 RAPIDS集或Pandas集。只需运行这些单元格之一。 该笔记本仅加载训练和测试数据集。

    1.3K20发布于 2021-07-02
  • 来自专栏素质云笔记

    nvidia-rapids︱cuML机器学习加速库

    cuML是一套用于实现与其他RAPIDS项目共享兼容API的机器学习算法和数学原语函数。 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 ---- 文章目录 1 安装与背景 1.1 安装 1.2 背景 2 DBSCAN 3 TSNE算法在 create -n cuml_dev python=3.7 --file=conda/environments/cuml_dev_cuda10.0.yml docker版本,可参考:https://rapids.ai Press Release NVIDIA Blog Developer Blog NVIDIA Data Science Webpage ---- 5 利用KNN进行图像检索 参考:在GPU实例上使用RAPIDS

    4.2K22发布于 2020-03-27
  • 来自专栏Python大数据分析

    RAPIDS cuDF,让数据处理飞起来~

    英伟达的RAPIDS cuDF就是利用GPU加速Pandas和Polars的一个神器,它可以让Pandas和Polars的代码运行在GPU上。 什么是RAPIDS cuDF? 接触过数据科学和机器学习的小伙伴可能都会知道英伟达的RAPIDS,它是大名鼎鼎的GPU加速系统,通过GPU的并行能力来为数据处理、机器学习提升效率。 接下来再来看看cuDF如何加速Polars GPU Engine,英伟达将RAPIDS cuDF中的能力迁移到了Polars之中。 如果是更深入的学习,则需要看RAPIDS的文档,虽然是英文的,但是读起来并不难。 通过利用GPU的并行计算能力,RAPIDS cuDF不仅大大提升了数据处理的速度,还简化了数据处理的复杂性。

    75400编辑于 2025-01-19
  • 来自专栏软硬件融合

    Intel Sapphire Rapids CPU,吹响反攻DPU的号角

    3 Intel Sapphire Rapids CPU介绍 Sapphire Rapids是Intel新一代的数据中心CPU,用于接替Ice Lake。 Sapphire Rapids相比Ice lake,从单个TILE变成了4个TILE的Chiplet集成。 而Sapphire Rapids的最大创新则是:AIA。 Sapphire Rapids的出现,第一次从CPU的视角,试图统一各种加速器和CPU的控制和数据交互方式,也即加速器呈现给Host CPU的架构。未来,AIA的方式能否成功,大家拭目以待。 Intel Sapphire Rapids,代表着CPU的一个重要的发展趋势是:CPU芯片不断融合各类加速器核,使得自己成为更加综合和均衡的新型处理器。

    82020编辑于 2022-12-16
  • 来自专栏素质云笔记

    NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10

    随着新版本的推出,RAPIDS 迎来了其推出一周年纪念日。回顾所经历的一年,RAPIDS团队就社区对该项目的关心和支持表示衷心的感谢。此前,RAPIDS获得了其首个BOSSIE奖。非常感谢各位的支持! 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 ---- 文章目录 RAPIDS RAPIDS定义 rapids背景资料 RAPIDS核心库更新 cuDF RAPIDS加速库 支持实例 如何在GPU实例上使用RAPIDS加速库 参考文献 ---- RAPIDS RAPIDS定义 RAPIDS,全称Real-time Acceleration Platform RAPIDS团队希望与你共同努力,不断完善RAPIDS

    3.6K31发布于 2020-03-27
  • 来自专栏素质云笔记

    nvidia-rapids︱cuGraph(NetworkX-like)关系图模型

    RAPIDS cuGraph库是一组图形分析,用于处理GPU数据帧中的数据 - 请参阅cuDF。 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 几个月前,RAPIDS收到了来自佐治亚理工学院的Hornet副本,并将其重构和重命名为cuHornet。 这一名称更改表明,源代码已偏离Georgia Tech基准并体现了代码API和数据结构与RAPIDS cuGraph的匹配。 cuGraph是RAPIDS的图形分析库,针对cuGraph我们推出了一个由两个新原语支持的多GPU PageRank算法:这是一个COO到CSR的多GPU数据转换器,和一个计算顶点度的函数。

    2.2K10发布于 2020-03-27
  • 来自专栏素质云笔记

    nvidia-rapids︱cuDF与pandas一样的DataFrame库

    ---- 官方文档: 1 Docs » API Reference 2 rapidsai/cudf 相关参考: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA 的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 - 此外,RAPIDS添加了cuStreamz元数据包,因此可以使用cuDF和Streamz库简化GPU加速流处理。 RAPIDS内存管理器库RMM也正在进行一系列重组。这次重组包括一个基于内存资源的新架构,该架构与C ++ 17 std :: pmr :: memory_resource大多兼容。 -c nvidia -c numba -c conda-forge \ cudf=0.10 python=3.6 cudatoolkit=10.1 docker版本,可参考:https://rapids.ai

    2.8K10发布于 2020-03-27
  • 来自专栏Python进阶之路

    Python 实用技能 RAPIDS | 利用 GPU 加速数据科学工作流程

    RAPIDS 官方文档:https://rapids.ai/index.html 介绍 RAPIDS:https://www.youtube.com/watch? Rapids 的美妙之处在于它与数据科学库的整合非常顺畅:像 pandas DataFrames 可以容易地传递到 Rapids,以实现 GPU 加速。 ---- 三、RAPIDS 实践 通过前面的了解,知道 RAPIDS 可以利用 GPU 加速数据科学。现在重要的是我们需要配置环境和实践一下,感受一下怎么用的! 要安装 RAPIDS,请访问:https://rapids.ai/start.html,在这里你将看到如何安装 RAPIDS。 】GPU数据科学加速包——RAPIDS

    3.1K51编辑于 2022-12-25
  • 英特尔顶级Granite Rapids CPU曝光:86核心,172线程

    9月28日消息,近日,英特尔最顶级的第六代Xeon处理器Granite Rapids-WS被曝光,其将拥有最高86个内核,172线程。 虽然,目前英特尔官方尚未公布关于Granite Rapids-WS的任何消息,但是其样品似乎已经发送给了合作伙伴进行测试。 近日,一款名为“Intel 0000”的处理器出现在OpenBenchmarking数据库当中,其BIOS版本名称正是“GNR-WS”,其所指的就是Granite Rapids Workstation。 如果看核心配置,英特尔的Granite Rapids-WS Xeon CPU将与Xeon 6700P系列非常相似,其最大内核为86个。 虽然英特尔Granite Rapids-WS在CPU内核数量方面已经接近AMD的Threadripper 9000的96个CPU内核,但仍落后了12%。

    20710编辑于 2026-03-20
  • 英特尔计划凭借18A制程的Clearwater Forest和Diamond Rapids重回巅峰

    △此前曝光的Clearwater Forest照片 英特尔指出,目前客户正在部署Granite Rapids 处理器,这是一个重要的跳跃式改进。 此外,Diamond Rapids 在规格上将采用巨大的LGA 9324 插槽。 △此前曝光的LGA 9324 插槽照片 Diamond Rapids 还将配备Panther Cove-X P 核心。 然而,尽管Diamond Rapids 的核心数量和具体规格目前尚不明朗,但有市场传闻指英特尔将在其中采用Intel 18A 制程技术。 至于,在市场定位方面,英特尔预计将把Diamond Rapids 定位为与AMD 的EPYC Venice 处理器竞争的产品。

    20210编辑于 2026-03-19
  • 来自专栏Hadoop实操

    0879-7.1.7-如何在CDP安装NVIDIA Tesla T4并使用RAPIDS加速

    ,手动狗头 比亚迪西安研发中心(与深圳协同办公),base西安,招聘大数据平台运维、架构方向的工程师,实时计算方向工程师,感兴趣的小伙伴请投递简历至dong.rui@byd.com 1.文档编写目的 RAPIDS 全称是Real-time Acceleration Platform for Integrated Data Science,是 NVIDIA 针对数据科学和机器学习推出的 GPU 加速库,RAPIDS NVIDIA借助这个功能,推出针对Spark的RAPIDS Plugin, 将Spark上数据处理迁移到GPU中,只需要用户做简单的代码修改,就可以感受GPU的高性能计算。 我们再来看看官方给出的ETL在CPU和GPU上的对比数据: 本文主要描述如何在CDP7.1.7中对计算节点安装NVIDIA Tesla T4,并使用RAPIDS对Spark3应用进行加速。 /spark-rapids/ Getting Startedhttps://nvidia.github.io/spark-rapids/docs/get-started/getting-started-on-prem.html

    1.2K20编辑于 2022-04-28
  • 来自专栏芯智讯

    英特尔第五代Xeon处理器细节曝光:最高64核心,性能提升40%!

    12月6日消息,英特尔很快即将在本月中旬正式发布代号为“Emerald Rapids”的面向数据中心的第五代 Xeon系列处理器。 近日,国外网友@InstLatX64 提前曝光了“Emerald Rapids”的详细信息。 另外,第五代 Emerald Rapids CPU已经由第四代 Sapphire Rapids 中的 4-tile 设计转变为 2-tile 设计。 Sapphire Rapids) 56 核 CPU 进行了比较。 与此同时,英特尔第五代 Emerald Rapids CPU 预计将于12 月 14 日推出。 编辑:芯智讯-浪客剑

    1.4K10编辑于 2023-12-12
  • 来自专栏相约机器人

    GPU加速数据分析和机器学习

    在本文中将首先介绍NVIDIA开源Python RAPIDS库,然后将提供RAPIDS如何将数据分析加速多达50次的实际演示。 图2:RAPIDS架构[3] 示范 现在展示与使用Pandas和Sklearn相比,使用RAPIDS如何能够实现更快的数据分析。 RAPIDS 为了将XGBoost与RAPIDS一起使用,首先需要以矩阵形式转换Training / Tests输入。 rapids_pred = clf.predict(dtest) rapids_pred = np.round(rapids_pred) rapids_acc = round(accuracy_score (y_test, rapids_pred), 2) print("XGB accuracy using RAPIDS:", rapids_acc*100, '%') 使用RAPIDS的模型的总体准确度等于

    1.6K30发布于 2019-07-30
  • 来自专栏量子位

    英伟达新开源GPU加速平台:主打数据科学和机器学习,50倍于CPU

    并且RAPIDS不是光比不用,发布之前,就已经经过一些企业真枪实弹检验。 比如沃尔玛。 开源 因为RAPIDS,可以说从开源社区中来,到开源社区中去。 此外,为了推动RAPIDS的广泛应用,英伟达也努力将RAPIDS与Apache Spark进行整合,后者是分析及数据科学方面领先的开源框架。 所以现在,全套RAPIDS开源库,前往 http://www.rapids.ai 就能获得,且代码经 Apache 许可公布。 最后,再次送上传送门: 全套RAPIDS开源库: http://www.rapids.ai — 完 —

    88830发布于 2018-11-22
  • 来自专栏GPUS开发者

    CUDA Python的「黄金三角」:PyTorch+RAPIDS+CuPy如何重构科学计算

    接下来我要提到的第二个核心入口点,相信很多人已经有所耳闻——RAPIDS。这是NVIDIA推出的开源SDK套件,包含一系列专为数据科学和机器学习设计的软件库与API。 RAPIDS生态的最大亮点在于其API的高度兼容性: 如果你熟悉NumPy,可以直接使用CuPy(GPU加速的数组计算库) 如果你习惯Pandas,可以无缝切换到cuDF(GPU版DataFrame) 从技术架构上看,CUDA数组接口(基于NumPy数组接口规范)被广泛支持: 跨框架兼容:Numba、PyTorch、PyArrow、JAX以及RAPIDS套件(cuDF、cuML等)均遵循此接口 统一内存模型 因为: -它延续了NumPy的API习惯,学习曲线平缓 -能快速验证算法在GPU上的可行性 -与其他GPU框架(如RAPIDS)的集成非常顺滑 当然,通往成功的道路有很多条。 从CuPy开始逐层向下深入: 上层框架(如RAPIDS或PyTorch)的演讲资料已有很多,它们提供更高级的抽象接口,开发者几乎无需关心硬件细节。

    62910编辑于 2025-04-18
  • 来自专栏大数据杂货铺

    从 CPU 切换到 GPU 进行纽约出租车票价预测

    NVIDIA RAPIDS 是一套软件库,可让您完全在 GPU 上运行端到端数据科学工作流。 RAPIDS 依靠 NVIDIA CUDA 原语进行低级计算优化,但通过用户友好的 Python 界面展现了高性能。 CML 和 NVIDIA 共同提供RAPIDS 版机器学习运行时。 RAPIDS 版运行时建立在社区构建的 RAPIDS docker 映像之上,使数据科学家只需单击一下按钮即可在 GPU 上启动和运行,他们需要的所有资源和库都触手可及。原因2得以解决。 为此,让我们探索 RAPIDS 提供的 Python 接口。 NVIDIA 声称 RAPIDS Python 界面是用户友好的。 最重要的是,只需切换到 RAPIDS 库并更改几行代码即可。

    2.8K20编辑于 2021-12-08
  • 来自专栏小白实例

    【玩转GPU】基于GPU云服务器实现MySQL数据库加速

    摘要:本文通过在GPU云服务器上部署和配置MySQL数据库,并使用RAPIDS GPU数据处理库进行加速,来详细阐述如何利用GPU强大的并行计算能力,加速MySQL数据库的查询和分析操作,使其比传统CPU 并初始化GPU环境RAPIDS是NVIDIA开源的GPU加速数据处理库。 安装RAPIDS:#安装RAPIDS依赖yum install -y python3 gcc-c++#安装RAPIDS库conda install -c nvidia -c rapidsai -c numba -c conda-forge \rapids-blazing=21.08 python=3.7 cudatoolkit=10.2然后我们需要初始化RAPIDS用于识别GPU:pythonimport 九、总结本文详细演示了如何在GPU云服务器上部署MySQL数据库,并使用RAPIDS等库实现GPU加速。GPU通过强大的并行计算能力,可以极大优化数据库查询、运算和分析性能。

    4.8K12编辑于 2023-07-19
  • 来自专栏自学气象人

    让python快到飞起 | 什么是 DASK ?

    以下是 NVIDIA 使用 Dask 正在进行的许多项目和协作中的几个: | RAPIDS RAPIDS 是一套开源软件库和 API,用于完全在 GPU 上执行数据科学流程,通常可以将训练时间从几天缩短至几分钟 NVTabular 能够利用 RAPIDS 和 Dask 扩展至数千个 GPU ,消除等待 ETL 进程完成这一瓶颈。 DASK + RAPIDS:在企业中实现创新 许多公司正在同时采用 Dask 和 RAPIDS 来扩展某些重要的业务。 NVIDIA 的一些大型合作伙伴都是各自行业的领导者,他们正在使用 Dask 和 RAPIDS 来为数据分析提供支持。 他们公开托管的托管部署产品为同时使用 Dask 和 RAPIDS 提供了一种强大而直观的方式。

    5.3K123编辑于 2022-11-02
  • 来自专栏芯智讯

    英特尔公布至强处理器路线图:两年四代产品,144核、Intel 18A都有!

    在今年年初,英特尔就发布了代号为Sapphire Rapids的第四代至强可扩展平台。接下来,在今年四季度,英特尔将会发布第五代的至强可扩展平台Emerald Rapids。 随后,英特尔还将推出基于Intel 3工艺,但均为P大核的至强平台Granite Rapids。 根据英特尔公布的数据显示,第四代至强Sapphire Rapids虽然有些姗姗来迟,但它已经赢得了450多款系统设计,创下历史新高。 至于2024年即将推出的Sierra Forest和Granite Rapids。 值得一提的是,Granite Rapids在内存、I/O上有创新突破,尤其是内存将支持到DDR5-8800 MCR RIDMM,最高带宽达到惊人的1.5TB/s,比现在提升83%。

    1.3K10编辑于 2023-04-11
  • 来自专栏芯智讯

    英特尔Granite Rapids Xeon CPU缓存容量将提升至480MB,比上一代高出50%

    1月22日消息,据外媒报道,英特尔第六代 Granite Rapids Xeon CPU的缓存容量将会进一步提升至480MB,相比不久前发布的第五代Emerald Rapids Xeon CPU提高50% 在此前的英特尔第五代 Emerald Rapids Xeon CPU上,其缓存容量相比上一代提升了3倍,直接从105 MB跃升至320MB。 根据SDE 9.33.0(软件开发模拟器)更新中的最新条目显示,即将于2024年上半年发布的第六代 Granite Rapids Xeon CPU将会配备高达480 MB 的 L3 缓存,这是一个巨大的增长 Granite Rapids 是否会使用该技术还有待观察,但 AMD 目前具有优势,并且为那些喜欢采用更高缓存路线的客户提供了解决方案。 Granite Rapids Xeon CPU 将与 AMD计划于今年发布的基于 Zen 5 核心架构的 EPYC Turin 芯片竞争。

    33110编辑于 2024-01-23
领券