未闻花名

文章/答案/技术大牛

发布

LV6

我关注的人

ModelEngine思想落地指南：用“智能体 + 插件”构建可复用AI应用.76

在AI应用开发过程中，我们常面临“重复造轮子”、“流程碎片化”、“技术门槛高”三大绊脚难题，不同场景需重新编写数据处理、工具调用逻辑，非专业人员难以参与，复杂流...

未闻花名 1天前2026-04-14 07:57:28

第四期热点征文-大模型技术

大模型应用：本地数学模型：从导数求解到公式推导轻松搞定数学任务.74

最近在实际应用的基础上深挖了一些算力和显存的底层业务，也被各种烧脑的计算算法折腾的心力交瘁，在这个过程中，我们基本都要么依赖笨重的专业数学软件，要么手动逐行推导...

未闻花名 3天前2026-04-12 08:58:23

第四期热点征文-大模型技术

大模型应用：快速搭建轻量级智能体：从模型下载到图文输出简单实践.75

最近大模型的算法理论着实让大家CPU都要冒烟了，缓缓换一些简单的动手实操，体验一下大模型的趣味，我们前期把 Transformer 架构、分词器工作原理、模型推...

未闻花名 2天前2026-04-13 07:50:33

传媒AIGC智能体解决方案

大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72

大模型的应用，算力成了我们逃脱不开的话题，往往我们在谈到模型应用这个事情，算力焦虑似乎成了我们都会遇到的痛点。不仅是我，我相信都会陷入“算力要显卡、加卡即提效”...

未闻花名 5天前2026-04-10 08:01:06

第四期热点征文-大模型技术

大模型应用：医疗行业大模型：从生成前校验到生成后审计的应用实践.73

医疗行业对准确性、合规性、安全性有着极高的要求，大模型在医疗场景，如病历撰写、医嘱辅助、医学科普、诊断建议参考等，不能简单直接的“输入-输出”，否则可能出现医疗...

未闻花名 4天前2026-04-11 07:58:01

AIGC、腾讯技术创作特训营S17#我与AI

大模型应用：批量文档摘要与分类实践：本地合同、报告数据处理与导出.70

在日常工作场景中，批量处理合同、报告类文档是高频刚需，传统人工逐份阅读、总结、分类的模式，不仅耗时耗力、易漏关键信息，还存在敏感数据泄露风险。而基于本地批量文档...

未闻花名 7天前2026-04-08 08:01:25

第四期热点征文-大模型技术

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

代表模型：GPT 系列、LLaMA 系列、Qwen 系列等。主要应用场景：自然语言生成任务，包括智能对话、文本创作、内容摘要、代码生成等。核心特点：

未闻花名 6天前2026-04-09 08:13:40

腾讯技术创作特训营S17#我与AI

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

在大模型落地实践中，我们都会面临一个共性困惑：明明显卡算力达标、模型量化适配，实际运行时却始终跑不满算力，甚至出现卡顿、显存溢出等问题。前文我们已详解算力指标（...

未闻花名 12天前2026-04-03 07:54:38

第四期热点征文-大模型技术

大模型应用：拆解大模型算力需求：算力是什么？怎么衡量？如何匹配？.64

对大模型而言，算力核心体现在“单位时间内完成矩阵乘法、注意力计算等核心操作的次数”。

未闻花名 13天前2026-04-02 07:59:13

腾讯技术创作特训营S17#我与AI

大模型应用：大模型内存与显存深度解析：我们该如何组合匹配模型与显卡.63

在大模型本地化部署的学习路上，我们都会经历懵懵懂懂、茫然无措的阶段，不是被五花八门的模型给整迷糊了，就是被一系列硬件适配问题困住：模型参数与显存占用到底如何精准...

未闻花名 14天前2026-04-01 07:59:32

腾讯技术创作特训营S17#我与AI

大模型应用：大模型权重敏感性分析：L1/L2 范数、梯度贡献深入解读.39

大模型的权重敏感性，通俗来说就是模型中某一个或某一组权重参数的微小变化，对模型最终输出结果或性能指标的影响程度。我们可以把大模型想象成一个精密的"黑箱计算器"，...

未闻花名 2026-03-082026-03-08 09:41:07

大模型部署

大模型应用：电商智能推荐：基于本地大模型的冷启动智能推荐系统实例.61

推荐系统是连接用户与信息的桥梁，核心目标是在海量信息中为用户精准匹配其感兴趣的内容、商品或服务，广泛应用于电商行业、内容平台、生活服务等场景。其核心价值体现在：

未闻花名 16天前2026-03-30 07:53:20

腾讯技术创作特训营S17#我与AI

大模型应用：本地部署 vs 云端调用：成本、隐私、效率、方式的综合考量.60

随着大模型技术的普及，不管是企业开发者还是个人爱好者，都绕不开一个核心抉择：大模型到底该放在自己的设备上跑，还是直接调用云端服务商提供的接口？这个问题其实很好理...

未闻花名 17天前2026-03-29 09:39:24

玩转腾讯混元大模型

大模型应用：Mistral-7B-Instruct 中文超长文本处理实战全解析.59

今天的核心目的就是为了做一个超长上下文处理的实践，我们常用的模型LLaMA-2 默认上下文长度为 4096 tokens，原生不支持滑动窗口！强行设置 conf...

未闻花名 18天前2026-03-28 10:16:47

第四期热点征文-大模型技术

大模型应用：稀疏注意力 vs 滑动窗口：大模型扩窗技术完全解析.58

我们应该也遇到过这样的情况，在和模型应用沟通的过程中，聊着聊着它就忘了开头的要求；或者让模型工具分析一本几百页的电子书，它只记住了最后几页的内容？我们也反复讨论...

未闻花名 19天前2026-03-27 07:58:39

第四期热点征文-大模型技术

大模型应用：上下文理解极限：Context Window 与注意力跨度的数学边界.57

在大模型的世界里，理解其处理长文本的能力，不能只看一个数字。我们常听到“支持128K上下文”这样的宣传，但真正决定模型能否有效利用这些信息的，远不止窗口长度本身...

未闻花名 20天前2026-03-26 07:53:20

第四期热点征文-大模型技术

大模型应用：大模型瘦身：量化、蒸馏、剪枝的基础原理与应用场景深度解析.56

如今大模型越来越火，不管是企业做业务落地，还是我们作为个人开发者上手体验，都绕不开一个核心问题：大模型虽强，但太笨重，动辄几十上百GB显存占用，普通硬件跑不动，...

未闻花名 21天前2026-03-25 07:57:12

第四期热点征文-大模型技术

大模型应用：高精度量化感知训练(QAT)与低成本后训练量化(PTQ)方案优选.55

在我们反复探讨的大模型落地的过程中，高性能与低成本的矛盾始终存在。想用好一个高性能拥有千亿参数大模型，都面临着存储占用高、推理速度慢的问题。模型量化作为一种核心...

未闻花名 22天前2026-03-24 07:56:40

第四期热点征文-大模型技术

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

大模型的量化我们前期也探讨了基础概念和实践原理，针对CPU的量化流程做了通俗易懂的基础说明，但实际应用场景往往是需要GPU的落地实践，随着大模型参数规模突破千亿...

未闻花名 23天前2026-03-23 08:52:14

第四期热点征文-大模型技术

大模型应用：大模型越大越好？模型参数量与效果的边际效益分析.51

我们接触大模型以来，经常听到什么模型有多少亿参数，通常1B/7B/13B/34B/70B/175B或者GPT有 1750 亿参等等这类说法，很容易让我们陷入模型...

未闻花名 26天前2026-03-20 07:58:44

第四期热点征文-大模型技术

12 下一页

个人简介

AI不释手 | 大健康产业
深耕青少年心理和医疗大健康领域，融合AI大模型的本地化应用，对大模型有深度的应用经验和使用体验。
腾讯云AI编程达人秀
暂未填写学校和专业
暂未填写个人网址
浙江省 | 杭州市
加入社区时间：2025-10-23

个人成就

获得 494 次赞同
文章被阅读 113.5K 次
文章获得 156 次首页推荐

关注了：0关注者：72

未闻花名

ModelEngine思想落地指南：用“智能体 + 插件”构建可复用AI应用.76

大模型应用：本地数学模型：从导数求解到公式推导轻松搞定数学任务.74

大模型应用：快速搭建轻量级智能体：从模型下载到图文输出简单实践.75

大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72

大模型应用：医疗行业大模型：从生成前校验到生成后审计的应用实践.73

大模型应用：批量文档摘要与分类实践：本地合同、报告数据处理与导出.70

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

大模型应用：拆解大模型算力需求：算力是什么？怎么衡量？如何匹配？.64

大模型应用：大模型内存与显存深度解析：我们该如何组合匹配模型与显卡.63

大模型应用：大模型权重敏感性分析：L1/L2 范数、梯度贡献深入解读.39

大模型应用：电商智能推荐：基于本地大模型的冷启动智能推荐系统实例.61

大模型应用：本地部署 vs 云端调用：成本、隐私、效率、方式的综合考量.60

大模型应用：Mistral-7B-Instruct 中文超长文本处理实战全解析.59

大模型应用：稀疏注意力 vs 滑动窗口：大模型扩窗技术完全解析.58

大模型应用：上下文理解极限：Context Window 与注意力跨度的数学边界.57

大模型应用：大模型瘦身：量化、蒸馏、剪枝的基础原理与应用场景深度解析.56

大模型应用：高精度量化感知训练(QAT)与低成本后训练量化(PTQ)方案优选.55

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

大模型应用：大模型越大越好？模型参数量与效果的边际效益分析.51

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐