https://medium.com/@karpathy/software-2-0-a64152b37c35 Andrej Karpathy 人工智能主任特斯拉。 26K 92 以下 Andrej Karpathy 人工智能主任特斯拉。以前在OpenAI的研究科学家和在斯坦福大学的博士生。我喜欢在大型数据集上训练深度神经网络。
机器之心报道 编辑:张倩、陈萍 Andrej Karpathy 又离职了! 看来,这一切对于Karpathy还不够有吸引力。 在Karpathy帖子的评论区,确实出现了一些比较有意思的「阴谋论」,比如有人说他是被马斯克派到OpenAI当间谍的,现在是时候回去了。 Andrej Karpathy个人经历 个人主页:https://karpathy.ai/ 2005-2009 年,Andrej Karpathy 本科就读于加拿大多伦多大学,主修计算机科学与物理,辅修数学 Karpathy 是 OpenAI 的创始成员和研究科学家。 Karpathy表示,新的视频已经在制作了。 这次的离开,相信 Karpathy 重新找回了自己的热情所在,我们也期待 Karpathy做出更多惊艳的研究成果。
Andrej Karpathy—OpenAI联合创始人、前Tesla AI总监、全球最受瞩目的AI研究者之一,在X上正式宣布:加入Anthropic。 这不是普通的人事变动。这是一个时代级别的信号。 Karpathy是谁?为什么他这么重要? 如果你对AI有所关注,Karpathy的名字你一定见过。 Karpathy将加入Anthropic的预训练团队(Pre-training Team),向团队负责人Nick Joseph汇报。 "我认为接下来几年大语言模型前沿领域将尤为关键。" Anthropic势头凶猛 Karpathy不是孤立事件。 Karpathy的离开,可能只是开始。 对普通人意味着什么?
作者 | 王玥 编辑 | 陈彩娴 7月13日下午,特斯拉AI主管Andrej Karpathy在推特宣布自己从供职5年的特斯拉离职。 图注:Andrej Karpathy 推特页面 Andrej Karpathy撰文称:“很高兴帮助特斯拉实现过去 5 年的目标,做出这个离开的决定十分艰难。 1 Andrej Karpathy 其人 Andrej Karpathy 于2009 年毕业于多伦多大学,获得计算机科学和物理学学士学位,2011 年毕业于不列颠哥伦比亚大学并完成硕士学位。 Andrej Karpathy乐于分享自己的思考见解,在推特和Medium上非常活跃,因此在网络上获得极大关注。 在今年4月,Andrej Karpathy宣布自己将休假4个月,在假期中会进行一些关于技术的思考。
2 月 4 日,Andrej Karpathy(OpenAI 联合创始人,前 Tesla AI 负责人)在 X 上发了一条长帖,纪念 Vibe Coding 诞生一周年。 01 Karpathy 到底说了什么 先还原原文关键信息。 Karpathy 承认,一年前他随手发的那条推文,没想到"Vibe Coding"能火成这样——上了维基百科,被所有科技公司引用,甚至 Sam Altman 都在用这个词。 03 我自己的体感 说实话,Karpathy 这次是在"追认"一个已经发生的事实。 过去三个月,我团队做了 30 多个出海小产品。 Karpathy 自己也说了:"It's something you can learn and become better at, with its own depth of a different
陈桦 编译整理 量子位 报道 | 公众号 QbitAI 今天,特斯拉新任命了一位人工智能主管:计算机视觉专家、李飞飞的得意门生Andrej Karpathy。 在TechCrunch报道了这个消息后,Karpathy自己也发Twitter表示“excited”: 这个职位的全名叫“人工智能和Autopilot视觉总监”,直接向马斯克汇报。 很多人是通过斯坦福大学广受欢迎的深度学习课程“用于视觉识别的卷积神经网络”认识Karpathy的。这门课通常被叫做CS231n,是他和李飞飞一起设计并进行教学的。 Karpathy拥有斯坦福大学计算机视觉博士学位,读博期间师从李飞飞,研究神经网络在计算机视觉、自然语言处理上的应用,以及在这两个领域的交叉应用。 Karpathy的本科和硕士分别就读于多伦多大学、英属哥伦比亚大学。 最近,他在OpenAI任研究员。 OpenAI……其实也是马斯克的领地,就是那个马斯克等硅谷大亨共同成立的非盈利人工智能项目。
特斯拉AI高级总监、自动驾驶视觉团队负责人Andrej Karpathy发布推文,宣布自己将离开特斯拉。 眼看真正「全自动驾驶」的目标遥遥无期,也许Andrej Karpathy可能只是心累了吧。 李飞飞高徒、「用爱发电」的技术大牛 可别小瞧这位Andrej Karpathy,他可是一个不折不扣的技术大牛。 毕业之后,Karpathy于2016年入职OpenAI并担任研究科学家,负责计算机视觉、生成建模和强化学习方面的深度学习。 2022/07/13/tesla-ai-leader-andrej-karpathy-announces-hes-leaving-the-company.html https://karpathy.ai
而关于接下来做什么,Karpathy 表示「自己还没有具体的计划,但希望重拾自己长久以来对 AI 技术工作、开源和教育等方面的热情。」 Karpathy 的离职看起来是「一场和平的分手」。 目前,在 Google Scholar 上,Karpathy 的论文引用数达到了 47911。 在特斯拉这五年 Karpathy 是 OpenAI 的创始成员和研究科学家。 在 Karpathy 离职之前,Autopilot 部门已经有 200 多名员工被裁。 参考内容: https://karpathy.ai/ https://www.linkedin.com/in/andrej-karpathy-9a650716/ https://www.theverge.com
年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言模型(LLM)的 30 分钟入门讲座,但该讲座当时没录制。 我们接下来整体了解一下 Karpathy 都讲到了哪些内容。视频主要分为三大部分展开,分别是 LLMs、LLMs 的未来和 LLM 安全。 在第一部分,Karpathy 首先介绍了 LLM 的一些入门知识,并以 Meta 推出的开源大模型 Llama 2-70b 为例讲解。 Karpathy 表示,模型推理可以在一台 MacBook 上运行,但模型训练过程耗费的计算量就非常大了。因此,我们需要对互联网内容进行压缩。 在谈到 LLM 的未来发展时,Karpathy 提到了 System 1 和 System 2 的思维模式。
机器之心报道 编辑:陈萍 Andrej Karpathy 用通俗易懂的语言介绍了 speculative execution。 符尧上述观点评论的是特斯拉前 AI 总监、年初重回 OpenAI 的 Andrej Karpathy 刚刚发布的一条推特。 为了让大家更好的理解 Karpathy 的内容。我们先介绍一下「Speculative decoding」方法,对后续理解更加有益,其主要用于加速大模型的推理。 介绍完「Speculative decoding」,我们再回到 Karpathy 的推特。Karpathy 是针对下面内容回复的。 Karpathy 表示:对于 LLM 来说,「Speculative execution」 是一种极好的推理 — 时间优化方法。
AI 大神 Andrej Karpathy 公开说出“我从未感觉自己作为程序员如此落后”时,你可能觉得这是一种谦虚或凡尔赛。 结语:新的鸿沟已经出现 Andrej Karpathy 在红杉的这场分享,让我们看到: 许多现有的软件和工作流正在迅速过时。 参考来源:Andrej Karpathy: From Vibe Coding to Agentic Engineering
CNTK更是不科学…… 昨天,手握ArXiv Sanity大数据、现在主管特斯拉人工智能部门的Andrej Karpathy,给出了更加精确的结果。 没错,上面的数据确实是过去一个月,Karpathy也在后面给出了更正说明。 ? Karpathy表示,综合过去6年发表在ArXiv的4300篇机器学习论文(数据来源:cs. 要知道,在2017年3月,Karpathy第一次做这个全面统计的时候,各框架的排名是: ? 那时候PyTorch才刚刚发布不久,Theano也没有说退休。
https://iclr-blog-track.github.io/blog/ 值得注意的是,被接收的 21 篇博客中有一篇是 ICLR 2022 官方特邀特斯拉人工智能和自动驾驶视觉总监 Andrej Karpathy 其中,Andrej Karpathy 复现了 Yann LeCun 等人 1989 年的一篇论文《Backpropagation Applied to Handwritten Zip Code Recognition 有趣的是,Karpathy 还展望了下一个 33 年,即 2055 年的人将如何看待今天的深度学习研究。这种跨越时空的对话蕴含着机器学习社区多年来的努力和对未来的美好期望。
选自Medium 机器之心编译 作者:Andrej Karpathy 参与:吴攀、李亚洲 当地时间 8 月 6 日到 11 日,第 34 届国际机器学习大会(ICML 2017)将在澳大利亚悉尼举办。 随后,李飞飞高徒 Andrej Karpathy 在其 Medium 博客上发布了一篇对这些被接收论文的分析文章,机器之心对本文进行了编译介绍,论文目录请访问官网:https://2017.icml.cc
v=zjkBMFhNj_g一、Andrej Karpathy是谁正式开始介绍视频内容前先来介绍一下视频作者Andrej Karpathy。 Andrej Karpathy最初任职于OpenAI公司,担任研究科学家的职位,主要关注深度学习、强化学习和生成模型等领域的研究。在他的领导下,OpenAI团队取得了一系列重要的研究成果。 而后,在2017年,Karpathy加入特斯拉,担任 Autopilot 人工智能的主管,负责领导自动驾驶汽车的深度学习和计算机视觉方面的研究。 2022 年 7 月,Karpathy 从特斯拉离职,并在接下来的几个月里,发表了一个详解反向传播的课程 、一份重写的 minGPT 库、一份从零开始构建 GPT 模型的完整教程等众多学习材料。 总之,Andrej Karpathy 是一位在深度学习和计算机视觉领域具有广泛影响力和贡献的研工程师,他对于LLM的理解一定是处于业界巅峰水平,这也就很好的解释了本文章要介绍的视频为何在一日之内就有20w
AndrejKarpathySkills:给ClaudeCode加四条行为约束发现了一个最近热度很高的仓库:forrestchang/andrej-karpathy-skills它做的事情很直接:把AndrejKarpathy 方式一:装成ClaudeCode插件先加marketplace:展开代码语言:TXTAI代码解释/pluginmarketplaceaddforrestchang/andrej-karpathy-skills 再安装:展开代码语言:TXTAI代码解释/plugininstallandrej-karpathy-skills@karpathy-skills这条适合想把它全局装进ClaudeCode的人。 直接放进项目里的CLAUDE.md新项目:展开代码语言:BashAI代码解释curl-oCLAUDE.mdhttps://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills 已有项目想追加:展开代码语言:BashAI代码解释echo"">>CLAUDE.mdcurlhttps://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills
机器之心报道 机器之心编辑部 官宣回归OpenAI,特斯拉前AI高级总监Andrej Karpathy的下家定了。 距离 Karpathy 的上一次离职,已经过去了八个月。 众所周知,Karpathy 是 OpenAI 的创始成员和研究科学家。但在 OpenAI 成立一年多后,Karpathy 便接受了马斯克的邀请,加入了特斯拉。 如今 Karpathy 选择回归 OpenAI,个中原因外界无法揣测。 Andrej Karpathy 的学术、职业生涯 2005-2009 年,Andrej Karpathy 本科就读于加拿大多伦多大学,主修计算机科学与物理,辅修数学。
Karpathy(OpenAI联合创始人、前特斯拉AI总监)最近提出了一个优雅的解法:LLM Wiki——不用向量数据库,不用传统RAG,让LLM自己维护一个Markdown知识库。 Karpathy的LLM Wiki是什么? 一句话:让LLM帮你维护一个结构化的Markdown知识库。 传统做法是这样的: 文档 → 分块 → Embedding → 向量数据库 → 检索 → LLM回答 Karpathy的做法是这样的: raw笔记 → LLM编译 → 结构化Wiki → 直接塞给LLM 一句话总结 Karpathy说:知识管理正在成为AI工作流的核心成本。用LLM Wiki + RAG,你可以在本地搭建一个真正可用的个人知识库——零API费用,完全离线,数据自己掌控。
前特斯拉AI高级总监Andrej Karpathy看完后大受震撼,也忍不住手痒尝试了一波。 「情人」 「狮子」 Leyendecker和Maxence笔下的「黑魂」 「赛博京剧」 彩蛋 感受一下特斯拉的前人工智能和自动驾驶视觉总监Andrej Karpathy被虐的心路历程。 看完大神制作的视频之后,Karpathy非常激动。 然后一波操作搞出来的成果,放进幼儿园小班里都毫无违和感。绝望的Karpathy直呼想要请一位「提示工程师」替自己创作。 最后Karpathy终于悟了,创作出了他非常满意的新作——蒸汽朋克人工神经网络机器,和蓝莓意大利面。
为了让资源有限的研究者也能体验一把玩大模型的乐趣,前特斯拉 AI 负责人 Andrej Karpathy 基于 PyTorch,仅用 300 行左右的代码就写出了一个小型 GPT 训练库,并将其命名为 时隔两年,minGPT 迎来更新,Karpathy 又上线新版本,并命名为 NanoGPT,该库用于训练和微调中型大小的 GPT。上线短短几天,狂揽 2.5K 星。 项目地址:https://github.com/karpathy/nanoGPT 在项目介绍中,Karpathy 这样写道:「NanoGPT 是用于训练和微调中型尺度 GPT 最简单、最快的库。 $ torchrun --standalone --nproc_per_node=4 train.py 为了让代码更有效,用户也可以从模型中进行取样: $ python sample.py Karpathy