首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >HCCL 测试准备

HCCL 测试准备

作者头像
用户12553134
发布2026-06-22 20:22:05
发布2026-06-22 20:22:05
850
举报

集合通信库HCCL(Huawei Collective Communication Library)是基于昇腾硬件的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案

在服务器上安装openmpi或者mpich,只是要编译,比较麻烦。建议做成docker镜像,在多机测试的时候更加方便。

设置环境变量,每次跑个测试往往一堆报错,原因就在没有设置好环境变量

export INSTALL_DIR=/usr/local/Ascend/cann

export PATH=/home/mpich/bin:$PATH

export LD_LIBRARY_PATH=/home/mpich/lib:{INSTALL_DIR}/lib64:LD_LIBRARY_PATH

export HCCL_SOCKET_FAMILY=AF_INET

export HCCL_SOCKET_IFNAME=bond0.1001

export HCCL_BUFFSIZE=2048

进入测试目录

cd /usr/local/Ascend/ascend-toolkit/latest/tools/hccl_test/

编辑hostfile,由每次测试的服务器数量决定。这次测试分单机,同个交换机下的2机,4机。跨交换机的8机,16机,32机,64机和全部的128机。

-rw-r--r-- 1 root root 14 Jun 18 03:34 hostfile

-rw-r--r-- 1 root root 1940 Jun 18 08:25 hostfile.128

-rw-r--r-- 1 root root 231 Jun 18 07:42 hostfile.16

-rw-r--r-- 1 root root 28 Jun 18 02:16 hostfile.2

-rw-r--r-- 1 root root 471 Jun 18 07:49 hostfile.32

-rw-r--r-- 1 root root 56 Jun 18 01:50 hostfile.4

-rw-r--r-- 1 root root 951 Jun 18 07:53 hostfile.64

-rw-r--r-- 1 root root 112 Jun 18 07:31 hostfile.8

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算力网络探索 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档