烟雨平生

文章/答案/技术大牛

发布

LV1

发表了文章 4天前2026-07-06 18:02:11

Agent Workflow vs Agent Loop——哪种才是正确的打开方式

去年我搭了一个Agent自动化系统，选了LangChain的Workflow模式，写得很爽——流程固定、逻辑清晰、上线快。三个月后系统上线，用户开始反馈各种奇怪...

烟雨平生 4天前2026-07-06 18:02:11

agent、workflow、框架、数据、系统

发表了文章 11天前2026-06-29 14:14:15

大模型推理优化——从KV Cache到投机解码，原理+实战

我盯着屏幕看推理时间——7秒一个token。心里咯噔一下，这不行啊。回头一看配置，一个Llama-2-7B，单张A100。理论上应该能跑飞快，结果慢得像卡在80...

烟雨平生 11天前2026-06-29 14:14:15

优化、原理、量化、模型、数据

发表了文章 16天前2026-06-24 16:00:09

别急着上Milvus——FAISS、Chroma、LanceDB，轻量级向量库怎么选

上次写了Pinecone、Milvus、Qdrant、Weaviate的横评，评论区有粉丝问：

烟雨平生 16天前2026-06-24 16:00:09

存储、服务、搜索、算法、性能

发表了文章 16天前2026-06-24 15:59:40

向量数据库怎么选——Pinecone、Milvus、Qdrant、Weaviate实测对比

我见过太多人——上周有个朋友问我："Milvus和Pinecone到底选哪个？"我说看你需求。他又问："那到底哪个好？"我说看你预算。他急了："你就告诉我选哪个...

烟雨平生 16天前2026-06-24 15:59:40

向量数据库、运维、部署、数据、性能

发表了文章 16天前2026-06-24 15:59:25

AI泡沫要破了？但是用AI写代码真的很6！所以到底啥子要破了嘛？

我打开代码编辑器，Claude帮我半小时写完了原来要搞一下午的接口联调。OpenClaw每天帮我自动写文章、发草稿、查天气、管日程。我用的RAG系统准确率从60...

烟雨平生 16天前2026-06-24 15:59:25

工作流、模型、数据中心、产品、工作

发表了文章 2026-06-092026-06-09 19:33:40

我用LangChain搭了个代码审查Agent，踩了3个坑

一开始觉得很简单：调用GitHub API获取PR diff，扔给GPT-4，拿到意见返回。

烟雨平生 2026-06-092026-06-09 19:33:41

prompt、配置、LLM、agent、diff

发表了文章 2026-06-082026-06-08 13:07:15

AI 智能体框架选型：7 个主流框架，我帮你捋清楚了

上个月我用 LangChain 搭了个 Agent，跑了三天就重构了。后来换成 LangGraph，又试了 Spring AI 和 AgentScope Jav...

烟雨平生 2026-06-082026-06-08 13:07:15

原型、java、框架、数据、系统

发表了文章 2026-06-052026-06-05 20:21:14

Solon AI Harness 深度解析：轻量灵活的引擎式架构

在 Java AI 智能体框架的竞争中，无耳科技的 Solon AI Harness 走了一条完全不同的路。不同于 AgentScope Java 的"大而全"...

烟雨平生 2026-06-052026-06-05 20:21:14

工具、架构、框架、设计、系统

发表了文章 2026-06-042026-06-04 12:52:12

AgentScope Java 深度解析：企业级 Harness 工程化框架

当阿里巴巴推出 AgentScope Java 时，很多人以为这只是 Python 版本的简单移植。但实际上，AgentScope Java 是一个完全不同的产...

烟雨平生 2026-06-042026-06-04 12:52:13

框架、响应式、java、工程化、工具

发表了文章 2026-06-032026-06-03 19:44:22

AgentScope Python 深度解析：大而全的 AI 智能体运行时

在 AI 智能体开发的浪潮中，阿里巴巴开源的 AgentScope 以其"大而全"的设计理念脱颖而出。

烟雨平生 2026-06-032026-06-03 19:44:22

系统、python、工具、可视化、设计

发表了文章 2026-06-012026-06-01 18:50:19

手撕 GPT#09：验证 loss 从 340 降到 6.5，模型却只会说“对对对”——小模型蒸馏的“不可能三角”

手撕 GPT 系列第 9 篇。前 8 篇我们训练了一个 3M 模型，发现天花板在容量。上一篇最后选了知识蒸馏这条路——让大模型教小模型。

烟雨平生 2026-06-012026-06-01 18:50:19

gpt、编码、乱码、模型、数据

发表了文章 2026-06-012026-06-01 18:45:29

手撕 GPT#08：你已经能训练模型了——接下来“撕”什么？

走到这儿，你已经不零基础了。但你可能不确定自己到底学会了什么，也不知道接下来该往哪走。

烟雨平生 2026-06-012026-06-01 18:45:30

gpt、架构、论文、模型、数据

发表了文章 2026-05-292026-05-29 13:12:37

手撕 GPT#07：我试了四个方向终于摸到了3M模型的天花板，最后还是成功了

手撕 GPT 系列第 7 篇。前 6 篇我们跑通了训练，模型通过了 6/6 验收。这篇记录的是：当我们试图让模型变得更好时，发现了什么。

烟雨平生 2026-05-292026-05-29 13:12:37

gpt、乱码、模型、数据、优化

发表了文章 2026-05-292026-05-29 13:12:11

手撕 GPT#06：手把手 30 分钟：零基础跑通你的第一个 GPT

问：什么是注意力机制？答：注意力机制通过计算查询和键的相关性分配权重，让模型动态关注最相关的部分。问：你是谁？答：我是一个基于 Transformer...

烟雨平生 2026-05-292026-05-29 13:12:11

基础、模型、数据、原理、gpt

发表了文章 2026-05-292026-05-29 13:11:53

手撕 GPT#05：316 万个参数、比照片还小的AI，为什么还能学会“说”中文？

但你可能注意到，我们的模型用了 GQA、SwiGLU、RMSNorm 这些词——它们不是原始论文里的东西。

烟雨平生 2026-05-292026-05-29 13:11:53

架构、模型、缓存、gpt、编码

发表了文章 2026-05-262026-05-26 19:38:32

手撕 GPT#04：我用CPU花20分钟训练了一个满分模型，问它一个问题，后悔了

这件事发生在我训练一个3M中文GPT小模型的时候。所有教程都不会告诉你答案。今天我来讲。

烟雨平生 2026-05-262026-05-26 19:38:32

gpt、架构、模型、数据、cpu

发表了文章 2026-05-252026-05-25 11:55:11

手撕 GPT#03：GPT 的核心代码只有 100 行，并且还支持注意力、权重、loss可视化哦

你可能好奇：模型里面到底在干什么？注意力机制是什么？位置编码是什么？因果掩码又是什么？

烟雨平生 2026-05-252026-05-25 11:55:11

网络、gpt、编码、可视化、模型

发表了文章 2026-05-252026-05-25 11:53:48

手撕 GPT#02：从乱码到说人话，模型经历了什么？

先忘掉"人工智能"、"神经网络"这些词。把模型想象成一个黑盒子，里面装了 316 万个数字。

烟雨平生 2026-05-252026-05-25 11:53:49

gpt、编码、乱码、模型、数据

发表了文章 2026-05-252026-05-25 10:19:51

手撕 GPT#01：五分钟上手，手把手带你用CPU 原生训练中文GPT模型，“我没有 GPU”的问题解了！！！

问：什么是注意力机制？答：注意力机制通过计算查询和键的相关性分配权重，让模型动态关注最相关的部分。问：RoPE 是什么？答：RoPE 是旋转位置编码，...

烟雨平生 2026-05-252026-05-25 10:19:51

cpu、gpt、gpu、模型、数据

发表了文章 2026-05-252026-05-25 10:19:16

我用OpenClaw搭了个个人自动化助手

查天气、定闹钟、发邮件、整理文件、看新闻、记笔记...这些事每件都要5分钟，一天加起来就是1-2小时。

烟雨平生 2026-05-252026-05-25 10:19:17

权限、同步、文件系统、自动化助手、self

12 3 4 5 6 7 8...16 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2017-12-01

个人成就

获得 424 次赞同
文章被阅读 395.6K 次

关注了：1关注者：47