并发控制在50左右，性能还是可以

用户12553134

发布于 2026-06-22 20:21:36

540

四台相同配置的服务器同样的脚本进行测试。

vllm bench serve --port 7000 --model /models --served-model-name ds --dataset-name random --random-input 200 --random-output 2048 --num-prompts 300 --request-rate 0.5 --max-concurrency 50 --save-result --result-dir ./result_optimized

一号机

二号机

三号机，并发跑到54后P99就飙升了。

四号机，并发高一个，TTFT和P99上升严重。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-13，如有侵权请联系 cloudcommunity@tencent.com 删除

并发

本文分享自算力网络探索微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度

并发控制在50左右，性能还是可以

并发控制在50左右，性能还是可以

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐