首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏新智元

    陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好

    比如Coq和Isabelle等证明助手,通过训练一个模型来一次预测一个证明步骤,并使用模型搜索可能的证明空间。 如上图所示,仅使用定理语句作为证明生成模型的输入,然后从模型中抽取证明尝试,并使用Isabelle执行证明检查。 如果Isabelle接受了证明尝试而没有错误,就说明证明成功;否则从证明生成模型中抽取另一个证明尝试。 Baldur在6336个Isabelle/HOL定理及其证明的基准上进行评估,从经验上证明了完整证明生成、修复和添加上下文的有效性。 Baldur可以与定理证明助手Isabelle合作,Isabelle对证明结果进行检查。当给定一个定理陈述时,Baldur几乎在41%的时间内能够生成一个完整的证明。

    45410编辑于 2024-02-06
  • 来自专栏汇智网教程

    收藏贴 :2019年必备43种区块链开发工具 原

    官网:https://coq.inria.fr 42、Isabelle Isabelle类似于COq,用来证明你的代码没有bug。 ? 官网:https://isabelle.in.tum.de 43、0x-monorepo 这是一个Solidity代码覆盖检查工具,可以用来测试你的智能合约。由0x protocal开发。 ?

    2.1K50发布于 2019-05-14
  • 来自专栏新智元

    超越DeepSeek推理,效率更高!斯坦福马腾宇新作:有限数据,无限迭代

    新智元报道 编辑:LRS 【新智元导读】STP(自博弈定理证明器)让模型扮演「猜想者」和「证明者」,互相提供训练信号,在有限的数据下实现了无限自我改进,在Lean和Isabelle验证器上的表现显著优于现有方法 研究人员在Lean和Isabelle上对该方法进行了实证评估,使用DeepSeek-Prover-V1.5-SFT作为STP的基础模型,在大约1.2亿个生成的证明和200万个生成的猜想的自我博弈训练后, 消融实验 生成的猜想提供了更多训练信号 在Isabelle实验中,研究人员使用中间模型对LeanWorkbook中的未证明命题和生成猜想的经验通过率进行了直方图分析。

    30910编辑于 2025-02-28
  • 来自专栏机器之心

    将数学题转化成代码,谷歌这项研究让机器证明的正确率大幅提高

    它能够将四分之一的问题转换为与形式证明求解程序 Isabelle 兼容的格式。 Wu 表示,许多不成功的转换是系统不理解某些数学概念的结果。 该模型不仅转换成了语法上正确的 Isabelle 代码,而且还能够掌握自然语言中的重要推理点。

    61820编辑于 2022-06-20
  • 来自专栏数据派THU

    将数学题转化成代码,谷歌这项研究让机器证明的正确率大幅提高

    它能够将四分之一的问题转换为与形式证明求解程序 Isabelle 兼容的格式。 Wu 表示,许多不成功的转换是系统不理解某些数学概念的结果。 该模型不仅转换成了语法上正确的 Isabelle 代码,而且还能够掌握自然语言中的重要推理点。

    40600编辑于 2022-07-19
  • 来自专栏深度学习自然语言处理

    开源LLEMMA发布:超越未公开的顶尖模型,可直接应用于工具和定理证明

    形式化数学(数学证明) 交互式证明助手,例如Lean和Isabelle,使用特殊的编程语言来帮助验证数学证明。但是,与常见的编程语言相比,这些特殊语言的数据非常少。 在给定问题、非正式证明和正式声明后,LLEMMA可以生成Isabelle代码的正式证明。此外,模型还可以根据证明助手给出的状态,生成证明的下一个步骤。 LLEMMA在Proof-Pile-2的预训练包括从Lean和Isabelle提取的正式数学数据,总计超过15亿个标记。

    1.2K40编辑于 2023-10-24
  • 自动化推理技术入门指南

    当前主要挑战包括:堆内存/并发等复杂场景处理底层编译器和硬件的正确性假设NP难问题的启发式算法优化学习资源推荐工具集:定理证明器:Coq, Isabelle, HOL-light模型检测:PRISM,

    22900编辑于 2025-08-09
  • 来自专栏机器之心

    陶哲轩上新项目:Lean中证明素数定理,研究蓝图都建好了

    值得注意的是,PNT 之前已被形式化过,由 Avigad 等人在 Isabelle 中完成。

    37210编辑于 2024-02-06
  • 来自专栏杨丝儿的小站

    UoE UG3 Inf Course Research

    Concrete Semantics with Isabelle/HOL, Springer, 2014. T. Nipkow, L. C. Paulson, and M. Wenzel. Isabelle/HOL: A Proof Assistant for Higher- Order Logic , Springer, 2002. M.Huth and M.Ryan.

    56940编辑于 2022-03-01
  • 来自专栏机器之心

    这场NeurIPS 2019研讨会,让新人与Bengio等大佬面对面交流,还颁发了三项论文奖

    Dietterich、Samy Bengio、Isabelle Guyon、Neil Lawrence、Masashi Sugiyama、Hugo Larochelle 诸位大佬的支持。 随后,巴黎萨克莱大学教授 Isabelle Guyon 做了开幕致辞。 ? 受邀出席的 Thomas G.

    67410发布于 2019-12-24
  • 来自专栏AI SPPECH

    Spark-Prover-X1-7B开源大模型:高效逻辑推理与验证的技术突破

    高度可靠、表达能力强 需要人工指导、学习曲线陡峭 高难度定理证明、形式化验证 自动定理证明器 E prover、Z3 自动化程度高、速度快 应用范围有限、缺乏灵活性 特定领域定理证明、约束求解 混合方法 Isabelle 优化硬件配置,使用并行推理 内存不足 批量过大、上下文过长 减小批量大小,缩短上下文长度 未来发展方向 模型规模扩展:进一步增加模型参数量,提升复杂定理证明能力 多语言支持:扩展到更多形式化语言(如Coq、Isabelle

    22510编辑于 2025-11-20
  • 来自专栏AI科技评论

    学界 | 一览 EMNLP 2018 开幕盛况:两千多篇论文投稿,参会人员翻倍

    Karl Stratos,Jun Suzuki; 信息提取和问答系统(Information Extraction and Question Answering):Jordan Boyd-Graber,Isabelle

    1.1K20发布于 2018-12-11
  • 来自专栏深度学习技术前沿

    【一周论文速递】自然语言处理最新论文!

    2] Generating Fact Checking Explanations 作者 | Pepa Atanasova, Jakob Grue Simonsen, Christina Lioma, Isabelle

    45730发布于 2020-05-18
  • 来自专栏算法channel

    降维技术 (Dimensionality Reduction)

    所以,鉴于上面的局限性, 于2002年,Isabelle Guyon等人发表了一篇文章,题目是 “Gene Selection for Cancer Classification using Support

    1.1K10发布于 2020-02-21
  • 来自专栏机器人网

    令人印象深刻的10张机器学习经典图片

    来自Isabelle Guyon的特征抽取教程. ? Feature combinations 5. 无关特征. 下图中, 使用y轴作为特征区分样本, 但是, 看起来是不是右图更容易混淆?

    1.4K40发布于 2018-07-23
  • 来自专栏脑机接口

    红色作为交通信号灯颜色是因为它对脑电波有影响吗?

    Stauch, Alina Peter, Isabelle Ehrlich, Zora Nolte以及ESI主编Pascal Fries的研究主要集中在早期视觉皮层,也称V1。

    46220编辑于 2023-02-14
  • 来自专栏机器之心

    现场 | NIPS举办了第一场记者发布会:请媒体警惕这波AI热潮

    在大会主席 Isabelle Guyon 和 Ulrike von Luxburg 介绍完 NIPS 的基本信息后,发布会也邀请了五位参会的学者分别对自己论文进行解读。 AlphaGo 只是完成了目标 机器学习没有魔法,目前的机器学习也没有产生革命性的影响,这是大会主席 Isabelle Guyon 所坚守的观点。

    68880发布于 2018-05-09
  • 来自专栏LINUX阅码场

    没有Bug的OS内核? 鸿蒙黑科技之操作系统形式验证与安全认证

    等最高安全级别认证的要求 符合ARINC653等操作系统的工业标准 支持多核/可抢占/可中断等形态的并发内核 覆盖安全模型、需求、设计到源码的形式验证 可集成所有模型和证据的统一开发与验证环境 我们已经在Isabelle 我们在Isabelle/HOL中完整实现了物联网OS的安全模型和形式开发框架,包括16000行形式规约与证明,并对ARINC 653标准和一些操作系统源码进行验证分析,发现其中10个Security缺陷 为了实现并发OS内存C代码的形式验证,我们在Isabelle/HOL中开发了并发C代码形式语言及验证方法,并对Zephyr内存管理模块的C代码都做了形式化建模,最后进行组合验证。 本成果构造了ISA2形式模型(ISA in ISABELLE),包括ISA形式模型基本框架、SPARC v8和RISC-V等ISA形式模型,覆盖物联网OS内核所需的所有指令。 在Isabelle中开发了15000行的模型和证明。 ISA2是可执行的模型,C代码编译得到的二进制程序在该模型上可以执行。

    4.7K30发布于 2019-08-20
  • 来自专栏北京马哥教育

    用十张图解释机器学习的基本概念

    Isabelle Guyon特征提取的幻灯片来看。 Irrelevant features 为什么无关紧要的特征会损害KNN,聚类,以及其它以相似点聚集的方法。

    842100发布于 2018-05-02
  • 来自专栏CDA数据分析师

    技能 | 10张图解释机器学习的基本概念

    Isabelle Guyon特征提取的幻灯片来看。 图5 5. Irrelevant features: 为什么无关紧要的特征会损害KNN,聚类,以及其它以相似点聚集的方法。

    78090发布于 2018-02-05
领券