差距不是一星半点实测下来,不同上下文长度场景下的生成速度差异非常明显:场景生成速度Prompt处理耗时体验评价短对话(<2KToken)~30-40tok/s1-2秒✅流畅中等对话(~8KToken)~20-30tok/s5
预后序列从临床+PRS模型开始,57.8%的患者发展到sMRI模型(补充S5-10)。