项目中频繁调用大模型 API,Token 消耗量很大,成本在持续增长。除了缩减调用频次,是否有其他策略可以优化 Token 使用效率?比如提示词优化、缓存机制、批量处理、模型选型等方面有什么建议?腾讯云有没有官方的 Token 优化指南或工具?
相似问题