首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏FreeBuf

    深度学习:能击败欧洲围棋冠军,还能防恶意软件

    上月底,权威科学杂志Nature发表了一篇关于谷歌人工智能程序AlphaGo击败欧洲围棋冠军的文章,其中介绍了AlphaGo程序的细节,它实际上是一个结合了深度学习与树搜索(tree-search)的程序

    1.5K70发布于 2018-02-07
  • 来自专栏AI科技大本营的专栏

    升级版“绝悟”AI自带“军师”,解禁王者荣耀全英雄池

    并结合各种新颖和成熟的方法,包括curriculum self-play learning、multi-head value estimation、policy distillation、Monte-Carlo tree-search

    95030发布于 2020-12-08
  • 来自专栏数据派THU

    独家 | 年度盘点!必看AI顶会论文、Github高星项目大合集(附链接)

    AAAI 2019获奖论文 论文1:How to Combine Tree-Search Methods in Reinforcement Learning 作者:Yonathan Efroni

    1.6K20发布于 2019-11-29
  • 来自专栏机器之心

    人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

    Alphazero-like tree-search can guide large language model decoding and training. arXiv preprint arXiv

    49800编辑于 2025-02-10
  • 来自专栏智能算法

    深度学习漫游指南:强化学习概览

    即使是仅仅训练策略网络,这种方法也比之前最著名的围棋算法Pachi更好,后者利用树搜索(tree-search)算法和启发式算法(heuristics)。

    80650发布于 2018-04-02
领券