首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >并发控制在50左右,性能还是可以

并发控制在50左右,性能还是可以

作者头像
用户12553134
发布2026-06-22 20:21:36
发布2026-06-22 20:21:36
540
举报

四台相同配置的服务器同样的脚本进行测试。

vllm bench serve --port 7000 --model /models --served-model-name ds --dataset-name random --random-input 200 --random-output 2048 --num-prompts 300 --request-rate 0.5 --max-concurrency 50 --save-result --result-dir ./result_optimized

一号机

二号机

三号机,并发跑到54后P99就飙升了。

四号机,并发高一个,TTFT和P99上升严重。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算力网络探索 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档