GPT-5.4 mini和nano支持40万token上下文窗口,价格更高但声称在代码生成任务中更高效。nano仅限API,面向高吞吐量分类和数据提取场景。
Small 4采用混合专家(MoE)架构,总参数量1190亿,激活参数仅60亿,融合推理、多模态和代码代理能力。
某机构宣布NeMo/“Open Shell”沙盒化代理运行时,提升知识工作自动化水平。
DLSS 5看起来像是一个针对视频游戏的实时生成式AI滤镜,通过AI生成画面细节提升画质与帧率。
注意力残差技术改进了Transformer中的注意力机制,通过残差连接提升信息流动和模型训练稳定性。
Mamba-3利用状态空间原理优化序列建模,在长序列处理效率和性能上取得进展。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。