──────────────────────┐ │ 流式ASR(Streaming ASR) │ │ Deepgram Nova 880ms 3.1.2 月度成本明细 模块 服务商 单价 月用量 月度费用 电话接入 Twilio Japan $0.01–0.015/分钟 3,000分钟 $45.00 ASR(流式) Deepgram Nova 替代 GPT-4o-mini,成本降低 80%,延迟相当 3.2.1 模块选型 模块 选型 延迟 月度费用 电话接入 Twilio Japan 30–50ms $45.00 ASR Deepgram Nova → 传统VAD等待静音才触发,增加200–400ms延迟 解决方案:预测性端点检测 配置参数(Deepgram): { "language": "ja", "model": "nova Google TTS 维度 数值 端到端延迟 410–880ms(目标 < 1秒) 月度成本 $103.90/月(约¥742) 按分钟成本 $0.035/分钟 日语ASR质量 优秀(Deepgram Nova
上:与自己模型对比;下:与市面其他模型对比 结果很明显,无论是和 Whisper v2/v3 比,还是和 Gemini、scribe-v1、nova-2 & nova-3 这些模型比,gpt-4o-transcribe