搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏GoCoding
AI 大模型职业选择
AI大模型职业方向AI大模型从训练到推理的路径，展开代码语言：TXTAI代码解释AI算法->AIInfra（基础设施）->AI编译器->AI芯片这也就有了四个方向。AI算法：本质是实验科学。 AIInfra与编译器：本质是系统工程。它拼的是工程能力、对性能的极致追求和全局视野，这是靠时间与经验积累起来的壁垒。AI算法和芯片是“造梦者”和“筑梦者”，而AIInfra与编译器则是“送梦者”。 AIInfra与编译器人才（极度紧缺的“蓝海”）现状：需求井喷，但供给严重不足。一个能熟练使用CUDA进行性能优化、或者能为PyTorch提交高质量代码的工程师，是所有AI公司都争抢的对象。如果说AI算法和芯片是“塔尖”和“塔基”，那AIInfra和编译器就是连接两者的“塔身”，而这个“塔身”目前正处于严重的“用工荒”状态。对我来说：AIInfra和编译器就是我这样的普通开发者进入AI大模型行业的“黄金入口”。如何入行？
39510编辑于 2026-03-19
2026-2027 大模型领域5大突破性方向展望
三、AIInfra革新：KVCache等核心算法突破，破解成本与速度瓶颈大模型的落地，不仅依赖上层模型架构的优化，更离不开底层基础设施（AIInfra）的支撑。下一个大进展，将来自于KVCache及相关AIInfra领域的革命性算法突破。总结：五大突破，共筑下一代AGI落地基石综上，智能体的无感交互、参数可调基座、AIInfra核心算法、多模态世界模型、长链路推理关键节点优化，这五大方向并非孤立存在，而是相互支撑、协同演进——交互方式的优化降低了落地门槛，可调基座提升了适配能力，AIInfra突破解决了成本瓶颈，世界模型实现了认知跃升，推理优化保证了应用可靠，五者共同构成了下一代AGI落地的核心基石。对于腾讯云开发者而言，这些突破不仅意味着全新的技术机遇，更意味着广阔的实践空间——无论是基于标准化智能体开发应用，还是利用可调基座快速适配行业场景，亦或是依托AIInfra优化部署成本，都将成为未来两年的核心技术实践方向
4.9K10编辑于 2026-03-15
好物周刊#145：浏览器 AI 助手
AIInfra[15] 跟大家一起探讨和学习人工智能、深度学习的系统设计，而整个系统是围绕着在 NVIDIA、ASCEND 等芯片厂商构建算力层面，所用到的、积累、梳理得到大模型系统全栈的内容。 mengjian-github/openclaw101 [14] OpenClaw 中文官方技能库: https://github.com/clawdbot-ai/awesome-openclaw-skills-zh [15] AIInfra : https://github.com/Infrasys-AI/AIInfra [16] Github: https://github.com/cunyu1943/weekly/ [17] 在线文档:
21310编辑于 2026-03-26
2025 腾讯云新质生产力的崛起 AI+时代的产业革新报告
#算力基础设施, #5G-A低时延网络, #空天地一体化网络, #低空智联网络, #算网数智基建, #数据空间, #智能体平台, #POI数据, #RTA数据, #网关, #WAF, #安全检测, #AIInfra
34620编辑于 2026-04-17
来自专栏AI杂谈
Anthropic封掉OpenClaw，顺手把SaaS的棺材盖钉死了
套用以前的话说，你如果不是AIinfra，新时代你没资格上桌的，朋友。
24620编辑于 2026-04-04
来自专栏大模型AI infra集群和网络协议
万卡集群如何破局哈希极化与拥塞抖动？深度解读腾讯星脉网络的 TCCL+GOR 协同架构
二、星脉网络AIinfra基础设施核心组件为应对上述挑战，腾讯星脉网络（AstralNetwork）提出多轨道和端网协同优化方案。
94610编辑于 2025-11-07
来自专栏大模型系列
腾讯元宝是什么？开源吗？
前OpenAI高级研究员姚顺雨加盟，担任“CEO/总裁办公室”首席AI科学家，同时兼任AIInfra部、大语言模型部负责人。姚顺雨是智能体产品operator与deepresearch的核心贡献者。 2025年12月17日，腾讯升级大模型研发架构，新成立AIInfra部、AIData部、数据计算平台部——将此前分散在各事业群的算力、数据等核心生产要素统一归口管理。
3.9K20编辑于 2026-03-27
DeepSeek技术解读：从V3到R1的MoE架构创新
国内很多人在看DeepSeek团队时，更多关注了他们做Training的能力，但实际上DeekSeek的AIInfra能力，特别时软硬件协同优化能力，才是他们超越国内其他大模型团队的关键。从DeepSeek的FP8训练框架来看，这个团队具有很强的技术和工程整合能力，已经不是单纯的大模型算法或AIInfra团队。3.2.2对英伟达GPU市场有巨大影响？有这个AIInfra能力的早就已经做了，没有这个能力也不会冒着成本不可控的风险冒然进入。 2024年5月推出的DeepSeek-V2就呈现出MLA和AIInfra技术的明显领先优势，极具性价比，引发了中国大模型市场的价格跳水和血拼。 V3和R1发布并开源后，DeepSeek进一步巩固了其在MoE性价比和AIInfra的地位，并以开源模型中几乎最出色的推理性能，赢得社会的广泛关注。
5410编辑于 2026-05-28
来自专栏腾讯云安全的专栏
「AI开源组件安全风险」系列一：配置缺陷，让你的GPU沦为矿机
后续我们将持续披露更多研究成果（如供应链安全，AIInfra安全等），敬请关注。二、AI开源组件配置缺陷，一个普遍存在的安全问题近年来，多个主流AI开源组件被披露存在因配置缺陷导致的高危问题。
55641编辑于 2026-03-17
从 Memory Storage 到 Memory Evolution：长期 Agent 的关键不是“记住”，而是“治理变化”
因为无论是教育Agent（需要知道你的弱项从听力变成了口语）、CodingAgent（需要知道你的技术栈从Java架构转向AIInfra）、企业Agent（需要知道项目目标已经变化）、还是PersonalAgent 欢迎同样关注AIInfra、Agent、RAG、Long-termMemory的朋友一起交流。如果未来AI真会成为长期伙伴，那么"记忆系统"这件事，很可能就是下一阶段最值得做深的基础设施之一。
35320编辑于 2026-05-18
来自专栏AI 应用架构
AI 工程的团队协作：从个人英雄主义到工程化分工
组织建议：开始有Prompt/SkillAuthor角色（可能还是兼任）；AIInfra专人化——MCP、可观测、CI/CD需要专门维护；QE开始萌芽——可能是PM兼任，但要有人对评测负责；建立ADR机制组织建议：角色完全分化——6个角色都有专人；建立中心化AIInfra团队——支撑业务团队；业务团队拥有自己的Skill/Prompt——中心团队制定规范；QE团队独立——评测体系成为基础设施；跨团队ArchitectureReviewBoard
34731编辑于 2026-05-23
DeepSeek-V3 高效训练关键技术分析
与其创新性的模型架构设计、高效的并行策略选择以及对集群通信和显存的极致优化密不可分，高效训练方法的表象是需要更少规模的算力，但其本质是对算法创新和极致集群性能的更高要求，所以DeepSeek-V3的先进经验对于AIInfra 绝不是利空，反而随着精细化的高效训练方法被业界普遍采用，基于先进芯片选型、先进架构搭建的AIInfra的重要性会越发凸显，持续学习。
5110编辑于 2026-05-28
高价值技术知识筛选框架——AI时代技术人的知识导航图
一位后端工程师评估“学Rust”vs“学大模型部署”：Rust：价值4，场景2（公司不用），能力3→总分3.0大模型部署：价值4，场景5（公司启动AI项目），能力4→总分4.4果断选择后者，3个月后成为AIInfra
42011编辑于 2025-11-28
来自专栏数据猿
同样做标注，为什么美国公司这么值钱?
词元调用量指数级增长，标志着数据要素通过可计价模式实现从供给到价值的闭环，大模型竞争正从能力比拼转向用量比拼，而AIInfra作为支撑调用规模扩张的核心环节，意味着算力、网络、数据调度等底层支撑系统必须同步甚至超前扩张
33710编辑于 2026-04-13
万字|AI王权终局：巨头之战，谁主沉浮？
新时代“ 代理式AI ”任务对AIinfra基础设施领域提出了全新挑战，尤其在传统代理式AI的预填充（Prefill）、解码（Decode）两个阶段尤为突出： ●预填充（Prefill）阶段：当用户发出一个复杂的指令时 1.1.3 Rubin平台：以解耦架构致胜未来面对代理式AI和具身智能时代对于AIinfra基础设施领域的挑战，英伟达推出下一代Rubin平台（“VeraCPU+RubinGPU(R200)+RubinCPX
93310编辑于 2025-12-22
来自专栏大模型系列
大模型推理强化学习算法解析：GRPO（Group Relative Policy Optimization）2026终极指南
它不再仅仅是一篇论文中的数学公式，而是化作了数万张H200/B300集群上日夜轰鸣的训练任务，化作了AIInfra工程师们调参面板上的默认选项，化作了无数Agent、代码助手、科学计算引擎背后沉默而强大的驱动力
27820编辑于 2026-05-25
来自专栏AI系统
【AI系统】大模型的到来
AISystem 与 AIInfra 在某种意义上，很多算法研究者或者系统研究者，没有很好地区分 AI System 和 AI Infra 之间的关系。
77410编辑于 2024-12-02
转载：【AI系统】大模型的到来
AISystem 与 AIInfra 在某种意义上，很多算法研究者或者系统研究者，没有很好地区分 AI System 和 AI Infra 之间的关系。
56810编辑于 2024-12-11
来自专栏LLM
必知必会：大模型训练通信开销计算详解与面试指南
出处：字节跳动/阿里云AIInfra岗位面试真题答案：通信瓶颈的核心判断指标是"计算开销/通信开销"的比值（Computation-to-CommunicationRatio）。
20310编辑于 2026-04-22

AI 大模型职业选择

2026-2027 大模型领域5大突破性方向展望

好物周刊#145：浏览器 AI 助手

2025 腾讯云新质生产力的崛起 AI+时代的产业革新报告

Anthropic封掉OpenClaw，顺手把SaaS的棺材盖钉死了

万卡集群如何破局哈希极化与拥塞抖动？深度解读腾讯星脉网络的 TCCL+GOR 协同架构

腾讯元宝是什么？开源吗？

DeepSeek技术解读：从V3到R1的MoE架构创新

「AI开源组件安全风险」系列一：配置缺陷，让你的GPU沦为矿机

从 Memory Storage 到 Memory Evolution：长期 Agent 的关键不是“记住”，而是“治理变化”

AI 工程的团队协作：从个人英雄主义到工程化分工

DeepSeek-V3 高效训练关键技术分析

高价值技术知识筛选框架——AI时代技术人的知识导航图

同样做标注，为什么美国公司这么值钱?

万字|AI王权终局：巨头之战，谁主沉浮？

大模型推理强化学习算法解析：GRPO（Group Relative Policy Optimization）2026终极指南

【AI系统】大模型的到来

转载：【AI系统】大模型的到来

必知必会：大模型训练通信开销计算详解与面试指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI 大模型职业选择

2026-2027 大模型领域5大突破性方向展望

好物周刊#145：浏览器 AI 助手

2025 腾讯云 新质生产力的崛起 AI+时代的产业革新 报告

Anthropic封掉OpenClaw，顺手把SaaS的棺材盖钉死了

万卡集群如何破局哈希极化与拥塞抖动？深度解读腾讯星脉网络的 TCCL+GOR 协同架构

腾讯元宝是什么？开源吗？

DeepSeek技术解读：从V3到R1的MoE架构创新

「AI开源组件安全风险」系列一：配置缺陷，让你的GPU沦为矿机

从 Memory Storage 到 Memory Evolution：长期 Agent 的关键不是“记住”，而是“治理变化”

AI 工程的团队协作：从个人英雄主义到工程化分工

DeepSeek-V3 高效训练关键技术分析

高价值技术知识筛选框架——AI时代技术人的知识导航图

同样做标注，为什么美国公司这么值钱?

万字|AI王权终局：巨头之战，谁主沉浮？

大模型推理强化学习算法解析：GRPO（Group Relative Policy Optimization）2026终极指南

【AI系统】大模型的到来

转载：【AI系统】大模型的到来

必知必会：大模型训练通信开销计算详解与面试指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

2025 腾讯云新质生产力的崛起 AI+时代的产业革新报告