索尼 AI 的研究人员和工程师开发了一系列创新性强化学习技术,包括如下: 一种名为 Quantile-Regression Soft Actor-Critic (QR-SAC) 的新型训练算法; 可被智能体理解的赛车规则编码