首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GoCoding

    AI 大模型职业选择

    AI大模型职业方向AI大模型从训练到推理的路径,展开代码语言:TXTAI代码解释AI算法->AIInfra(基础设施)->AI编译器->AI芯片这也就有了四个方向。AI算法:本质是实验科学。 AIInfra与编译器:本质是系统工程。它拼的是工程能力、对性能的极致追求和全局视野,这是靠时间与经验积累起来的壁垒。AI算法和芯片是“造梦者”和“筑梦者”,而AIInfra与编译器则是“送梦者”。 AIInfra与编译器人才(极度紧缺的“蓝海”)现状:需求井喷,但供给严重不足。一个能熟练使用CUDA进行性能优化、或者能为PyTorch提交高质量代码的工程师,是所有AI公司都争抢的对象。 如果说AI算法和芯片是“塔尖”和“塔基”,那AIInfra和编译器就是连接两者的“塔身”,而这个“塔身”目前正处于严重的“用工荒”状态。 对我来说:AIInfra和编译器就是我这样的普通开发者进入AI大模型行业的“黄金入口”。如何入行?

    39510编辑于 2026-03-19
  • 2026-2027 大模型领域5大突破性方向展望

    三、AIInfra革新:KVCache等核心算法突破,破解成本与速度瓶颈大模型的落地,不仅依赖上层模型架构的优化,更离不开底层基础设施(AIInfra)的支撑。 下一个大进展,将来自于KVCache及相关AIInfra领域的革命性算法突破。 总结:五大突破,共筑下一代AGI落地基石综上,智能体的无感交互、参数可调基座、AIInfra核心算法、多模态世界模型、长链路推理关键节点优化,这五大方向并非孤立存在,而是相互支撑、协同演进——交互方式的优化降低了落地门槛 ,可调基座提升了适配能力,AIInfra突破解决了成本瓶颈,世界模型实现了认知跃升,推理优化保证了应用可靠,五者共同构成了下一代AGI落地的核心基石。 对于腾讯云开发者而言,这些突破不仅意味着全新的技术机遇,更意味着广阔的实践空间——无论是基于标准化智能体开发应用,还是利用可调基座快速适配行业场景,亦或是依托AIInfra优化部署成本,都将成为未来两年的核心技术实践方向

    4.9K10编辑于 2026-03-15
  • 好物周刊#145:浏览器 AI 助手

    AIInfra[15] 跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着在 NVIDIA、ASCEND 等芯片厂商构建算力层面,所用到的、积累、梳理得到大模型系统全栈的内容。 mengjian-github/openclaw101 [14] OpenClaw 中文官方技能库: https://github.com/clawdbot-ai/awesome-openclaw-skills-zh [15] AIInfra : https://github.com/Infrasys-AI/AIInfra [16] Github: https://github.com/cunyu1943/weekly/ [17] 在线文档:

    21310编辑于 2026-03-26
  • 2025 腾讯云 新质生产力的崛起 AI+时代的产业革新 报告

    #算力基础设施, #5G-A低时延网络, #空天地一体化网络, #低空智联网络, #算网数智基建, #数据空间, #智能体平台, #POI数据, #RTA数据, #网关, #WAF, #安全检测, #AIInfra

    34620编辑于 2026-04-17
  • 来自专栏AI杂谈

    Anthropic封掉OpenClaw,顺手把SaaS的棺材盖钉死了

    套用以前的话说,你如果不是AIinfra,新时代你没资格上桌的,朋友。

    24620编辑于 2026-04-04
  • 来自专栏大模型AI infra集群和网络协议

    万卡集群如何破局哈希极化与拥塞抖动?深度解读腾讯星脉网络的 TCCL+GOR 协同架构

    二、星脉网络AIinfra基础设施核心组件为应对上述挑战,腾讯星脉网络(AstralNetwork)提出多轨道和端网协同优化方案。

    94610编辑于 2025-11-07
  • 来自专栏大模型系列

    腾讯元宝是什么?开源吗?

    前OpenAI高级研究员姚顺雨加盟,担任“CEO/总裁办公室”首席AI科学家,同时兼任AIInfra部、大语言模型部负责人。姚顺雨是智能体产品operator与deepresearch的核心贡献者。 2025年12月17日,腾讯升级大模型研发架构,新成立AIInfra部、AIData部、数据计算平台部——将此前分散在各事业群的算力、数据等核心生产要素统一归口管理。

    3.9K20编辑于 2026-03-27
  • DeepSeek技术解读:从V3到R1的MoE架构创新

    国内很多人在看DeepSeek团队时,更多关注了他们做Training的能力,但实际上DeekSeek的AIInfra能力,特别时软硬件协同优化能力,才是他们超越国内其他大模型团队的关键。 从DeepSeek的FP8训练框架来看,这个团队具有很强的技术和工程整合能力,已经不是单纯的大模型算法或AIInfra团队。3.2.2对英伟达GPU市场有巨大影响? 有这个AIInfra能力的早就已经做了,没有这个能力也不会冒着成本不可控的风险冒然进入。 2024年5月推出的DeepSeek-V2就呈现出MLA和AIInfra技术的明显领先优势,极具性价比,引发了中国大模型市场的价格跳水和血拼。 V3和R1发布并开源后,DeepSeek进一步巩固了其在MoE性价比和AIInfra的地位,并以开源模型中几乎最出色的推理性能,赢得社会的广泛关注。

    5410编辑于 2026-05-28
  • 来自专栏腾讯云安全的专栏

    「AI开源组件安全风险」系列一:配置缺陷,让你的GPU沦为矿机

    后续我们将持续披露更多研究成果(如供应链安全,AIInfra安全等),敬请关注。二、AI开源组件配置缺陷,一个普遍存在的安全问题近年来,多个主流AI开源组件被披露存在因配置缺陷导致的高危问题。

    55641编辑于 2026-03-17
  • 从 Memory Storage 到 Memory Evolution:长期 Agent 的关键不是“记住”,而是“治理变化”

    因为无论是教育Agent(需要知道你的弱项从听力变成了口语)、CodingAgent(需要知道你的技术栈从Java架构转向AIInfra)、企业Agent(需要知道项目目标已经变化)、还是PersonalAgent 欢迎同样关注AIInfra、Agent、RAG、Long-termMemory的朋友一起交流。如果未来AI真会成为长期伙伴,那么"记忆系统"这件事,很可能就是下一阶段最值得做深的基础设施之一。

    35320编辑于 2026-05-18
  • 来自专栏AI 应用架构

    AI 工程的团队协作:从个人英雄主义到工程化分工

    组织建议:开始有Prompt/SkillAuthor角色(可能还是兼任);AIInfra专人化——MCP、可观测、CI/CD需要专门维护;QE开始萌芽——可能是PM兼任,但要有人对评测负责;建立ADR机制 组织建议:角色完全分化——6个角色都有专人;建立中心化AIInfra团队——支撑业务团队;业务团队拥有自己的Skill/Prompt——中心团队制定规范;QE团队独立——评测体系成为基础设施;跨团队ArchitectureReviewBoard

    34731编辑于 2026-05-23
  • DeepSeek-V3 高效训练关键技术分析

    与其创新性的模型架构设计、高效的并行策略选择以及对集群通信和显存的极致优化密不可分,高效训练方法的表象是需要更少规模的算力,但其本质是对算法创新和极致集群性能的更高要求,所以DeepSeek-V3的先进经验对于AIInfra 绝不是利空,反而随着精细化的高效训练方法被业界普遍采用,基于先进芯片选型、先进架构搭建的AIInfra的重要性会越发凸显,持续学习。

    5110编辑于 2026-05-28
  • 高价值技术知识筛选框架——AI时代技术人的知识导航图

    一位后端工程师评估“学Rust”vs“学大模型部署”:Rust:价值4,场景2(公司不用),能力3→总分3.0大模型部署:价值4,场景5(公司启动AI项目),能力4→总分4.4果断选择后者,3个月后成为AIInfra

    42011编辑于 2025-11-28
  • 来自专栏数据猿

    同样做标注,为什么美国公司这么值钱?

    词元调用量指数级增长,标志着数据要素通过可计价模式实现从供给到价值的闭环,大模型竞争正从能力比拼转向用量比拼,而AIInfra作为支撑调用规模扩张的核心环节,意味着算力、网络、数据调度等底层支撑系统必须同步甚至超前扩张

    33710编辑于 2026-04-13
  • 万字|AI王权终局:巨头之战,谁主沉浮?

    新时代“ 代理式AI ”任务对AIinfra基础设施领域提出了全新挑战,尤其在传统代理式AI的预填充(Prefill)、解码(Decode)两个阶段尤为突出: ●预填充(Prefill)阶段: 当用户发出一个复杂的指令时 1.1.3 Rubin平台:以解耦架构致胜未来 面对代理式AI和具身智能时代对于AIinfra基础设施领域的挑战,英伟达推出下一代Rubin平台(“VeraCPU+RubinGPU(R200)+RubinCPX

    93310编辑于 2025-12-22
  • 来自专栏大模型系列

    大模型推理强化学习算法解析:GRPO(Group Relative Policy Optimization)2026终极指南

    它不再仅仅是一篇论文中的数学公式,而是化作了数万张H200/B300集群上日夜轰鸣的训练任务,化作了AIInfra工程师们调参面板上的默认选项,化作了无数Agent、代码助手、科学计算引擎背后沉默而强大的驱动力

    27820编辑于 2026-05-25
  • 来自专栏AI系统

    【AI系统】大模型的到来

    AISystem 与 AIInfra 在某种意义上,很多算法研究者或者系统研究者,没有很好地区分 AI System 和 AI Infra 之间的关系。

    77410编辑于 2024-12-02
  • 转载:【AI系统】大模型的到来

    AISystem 与 AIInfra 在某种意义上,很多算法研究者或者系统研究者,没有很好地区分 AI System 和 AI Infra 之间的关系。

    56810编辑于 2024-12-11
  • 来自专栏LLM

    必知必会:大模型训练通信开销计算详解与面试指南

    出处:字节跳动/阿里云AIInfra岗位面试真题答案:通信瓶颈的核心判断指标是"计算开销/通信开销"的比值(Computation-to-CommunicationRatio)。

    20310编辑于 2026-04-22
领券