比较少见的机型,先看看NPU之间的互联情况
一卡两芯片的设计
看到一个说法:对AI研究来说,带宽没那么重要。大不了从1小时出结果等成过夜出结果。但有96GB显存意味着它能装下的模型。在这种情况下还是适用。不过就只能单卡跑。
把模型做TP后进行性能测试,结果惨不忍睹。机内跨CPU和NUMA和PCIE的叠加就是个灾难。
本文分享自 算力网络探索 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!