搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏GiantPandaCV
AI Infra论文阅读之LIGHTSEQ（LLM长文本训练的Infra工作）
介于篇幅原因，这篇文章只读一下这篇paper，把握一下核心的Infra相关的idea。这篇paper应该还没有中会议，处于openreview阶段。
75010编辑于 2024-02-22
来自专栏老张的求知思考世界
AI Agent Infra领域的工具图谱
因此我才会在前面介绍智能体基础架构的文章中断言道：Agent Infra是Agent落地的关键！因为它涵盖了Agent从开发到部署的完整生命周期。目前在Agent Infra层面，可以大致划分为这四个赛道：Environment、Context、Tools、Agent Security。下面是我查阅很多资料后整理的Agent Infra工具图谱，供大家参考。
1.2K10编辑于 2025-06-25
张量广播机制【Ai Infra 3.0】
当对张量执行逐元素操作（如加法、减法或乘法）时，它们的形状通常需要对齐。但是，手动调整或重复张量以匹配形状可能会很繁琐且效率低下，尤其是在处理大型数据集时。PyTorch 通过一种称为**广播（broadcasting）**的机制解决了这个问题。
15210编辑于 2026-03-13
来自专栏vpp开发与应用
VPP 测试框架之infra基础库测试
该系列文章有4篇：VPP 测试框架之官方文档解读VPP 测试框架之使用示例及参数说明VPP Bond单元测试源码分析Vpp 测试框架之infra基础库测试（本文）本文已同步至：个人博客：itwakeup.com 微信公众号：vpp与dpdk研习社（vpp_dpdk_lab）1. infra单元测试在src/vppinfra/test/目录下，有许多通过REGISTER_TEST注册的单元测试，用于对vppinfra 编译 test_infra执行make build生成可执行文件test_infra1.2. 运行参数说明test_infra运行参数说明：perf：携带该参数将运行性能测试，默认为功能测试。 /build-root/build-vpp_debug-native/vpp/bin/test_infra filter toeplitzMultiarch Variant: default------ /build-root/build-vpp_debug-native/vpp/bin/test_infra perfWarming up...Multiarch Variant: default----
44210编辑于 2025-09-14
腾讯云Agent Infra解决方案概要
一、产品定位与核心亮点技术定义：Agent Infra（智能体基础设施）解决方案，核心为Agent Runtime，集成AI运行时（执行引擎）、云沙箱、安全可观测等核心模块。商业差异化卖点：为智能体提供稳定、安全、可弹性伸缩的运行环境，将开发团队从复杂底层基础设施（Infra）问题中解放，专注Agent本身创新。
27120编辑于 2026-04-06
腾讯云 Agent Infra 解决方案技术概要
一、产品定位与核心亮点腾讯云 Agent Infra（智能体基础设施）解决方案——Agent Runtime，是为AI智能体（Agent）提供的专用运行环境。
42630编辑于 2026-04-06
来自专栏机器之心
大模型最难的AI Infra，用Vibe Coding搞定
然而，当我们目光转向实际的系统，特别是 AI Infra 这种复杂系统时，Vibe Coding 就会常常会陷入「水土不服」的困境。总结下来，主要有这三个方面的问题。而这些问题背后的根源在于：AI Infra 到底还是个复杂系统，动辄数万行代码、成百上千个相互关联的决策点，而当前的对话式编程缺乏持久化、结构化的决策管理机制。换句话说，Vibe 本身是模糊且不稳定的，无法支撑严肃复杂的 Infra。不过 Vibe Coding 的发展不可逆，其广泛应用的潜力不应就此止步。要让 Vibe Coding 真正适用于 AI Infra 开发，我们实践了文本驱动的 Vibe Coding 方法：通过设计文档将所有关键决策体系化、持久化。 AI Infra 中的资源调度系统，尤其是面向 Agentic RL，正是这样一个理想试验场。该系统是数万行代码的分布式训练系统，面临 GPU 利用率优化的复杂挑战，涉及核心调度逻辑改动。
33110编辑于 2026-01-12
来自专栏木鸟杂记
Infra 面试之数据结构五：顺序组装
参考资料 [1] 系统日知录: https://xiaobot.net/p/system-thinking [2] infra 程序员面试题目大全: https://github.com/DistSysCorp /infra-interview/tree/main/data_structures
25310编辑于 2024-05-08
腾讯云发布AI infra品牌“腾讯云智算”
9月5日，在腾讯全球数字生态大会上，腾讯云正式发布AI infra品牌“腾讯云智算”。
2.4K10编辑于 2024-09-05
HackMD 和 Obsidian 或许是智能体的Infra
20010编辑于 2026-04-29
来自专栏AI
拥抱 AI 范式革新：如何成为 AI Infra 核心专家
在大模型、多模态与智能体技术爆发的今天，AI Infra 正从 “支撑算力供给” 的幕后角色，走向 “定义智能生产方式” 的核心舞台。在这样的浪潮中，AI Infra 专家的价值被重新定义 —— 他们不仅是算力的管理者，更是智能系统的架构师、效率的革新者与业务的赋能者。一、AI Infra 的范式革新：从 “算力供给” 到 “智能生产”过去，AI Infra 的核心目标是 “让模型训得更快”。二、AI Infra 核心专家的全栈技术栈要成为 AI Infra 核心专家，必须构建覆盖 “硬件 - 分布式 - 框架 - 工程化 - 架构设计” 的全栈能力。1. 行业标准：参与制定 AI Infra 标准、开源贡献、技术布道。业务赋能：理解业务场景，设计最优 AI Infra 方案，支撑智能体、多模态、世界模型等新应用。
1.1K12编辑于 2026-02-13
腾讯云 Agent Infra (智能体基础设施) 核心技术与架构解析
一、产品定位与核心亮点腾讯云 Agent Infra（Agent Runtime）是一款专为 AI Agent（智能体）设计的底层基础设施解决方案（当前执行引擎与云沙箱组件处于开放内测阶段）。
84540编辑于 2026-04-06
来自专栏GiantPandaCV
AI Infra论文阅读之《在LLM训练中减少激活值内存》
0x4.2.3 Pipline并行 GPipe->1F1B Pipline并行可以读我之前写的这篇paper解读：AI Infra论文阅读之将流水线并行气泡几乎降到零（附基于Meagtron-LM的ZB-H1
1.7K10编辑于 2024-03-26
来自专栏存储公众号：王知鱼
【企业级AI infra】IBM Vela系统：AI计算的革新之路
AI工作负载对 Infra 的要求幻灯片描述了AI工作负载的不同阶段（数据准备、分布式训练、模型调优、推理）以及每个阶段所需的基础设施类型和时间要求。
81010编辑于 2025-03-10
腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%
腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。目前，HPC-Ops 已在 github 开放源码供开发者下载使用，同时腾讯混元infra团队也表示，欢迎行业内的技术实践者提交高价值 PR，参与算子边缘场景优化、教程案例打磨等精准化贡献，共同推动大模型推理技术的边界拓展
61110编辑于 2026-02-07
来自专栏深度学习与python
Agent规模化落地前夜，AI Infra的难题全都暴露了
InfoQ 特别邀请 IDC 高级研究经理张犁、智诊科技产品总监罗龙生、腾讯云异构计算高级产品经理黄阳，解析 AI Infra 的六大核心能力、Agent 规模化的结构性难题、AI Infra 价值闭环衡量标准 IDC 总结出了 AI Infra 应具备的六个关键模块：异构算力调度能力：针对当前算力多元化的发展趋势，AI Infra 通过算力调度技术和平台，实现对异构算力芯片的深度适配和统一纳管，能够根据不同业务场景进行高效的算力选型 AI Infra 的风险和成本控制明确了衡量 AI Infra 能力的宏观框架，实际落地过程中，企业还需要用可量化的方式，判断 AI Infra 在具体业务场景的价值。他指出，企业的集中需求，正促使整个 AI Infra 行业都在朝着更灵活、更智能的方向发展。 AI Infra 下一阶段的竞争逻辑随着 Agent 在行业中加速落地，AI Infra 的竞争开始从“比技术”走向“比业务价值”。
62810编辑于 2025-11-26
来自专栏腾讯开源的专栏
开源公告｜AI-Infra-Guard(AI基础设施安全评估工具) 发布
安装与使用 ● 安装下载地址: https://github.com/Tencent/AI-Infra-Guard/releases ● 使用单个目标 . /ai-infra-guard -target [IP/域名] 多个目标 ./ai-infra-guard -target [IP/域名] -target [IP/域名] 从文件读取 . /ai-infra-guard -file target.txt AI分析 . /ai-infra-guard -target [IP/域名] -ai -token [混元token] 指纹匹配规则 AI Infra Guard 基于WEB指纹识别组件，指纹规则在data/fingerprints 项目地址 Github地址：https://github.com/Tencent/AI-Infra-Guard 请给项目一个 Star ! 欢迎提出你的 issue 和 PR！
2.6K10编辑于 2025-02-05
来自专栏FreeBuf
又见供应链威胁：漏洞“INFRA：HALT ”影响数百家供应商的OT设备
Forescout和JFrog Security研究人员在NicheStack中发现的14个漏洞被统称为“INFRA:HALT”，允许远程代码执行、拒绝服务、信息泄漏、TCP 欺骗和DNS缓存中毒。 INFRA：NicheStack中的HALT漏洞在过去的两年里，来自多家公司的研究人员亲自探索物联网、OT和嵌入式设备/系统中使用的各种TCP/IP堆栈的安全性，并记录了他们的发现。
58330发布于 2021-08-24
AI Infra安全体系构建：应对大模型时代五大核心风险的纵深防御实践
剖析行业战略困境与核心瓶颈 AI技术变革推动2026年金融行业全面迈入大模型应用阶段，传统IT基础设施向AI Infra演进，攻击面急剧扩大。
87120编辑于 2026-04-03
来自专栏自然语言处理
DeepSeek开源周 Day02：从DeepEP开源趋势重新审视大模型Infra
/ 关于大模型Infra思考 LLM Infra 简介 LLM Infra（大语言模型基础设施，LLM Infrastructure）是 LLM 实践和应用的底座。 LLM AI Infra广义上包含了基础模型和基础软件栈两层，本篇报告核心关注其中和工作流相关的基础软件工具栈。 LLM Infra从业建议在知乎看到一篇非常有意思的文章，分享给大家：大模型Infra这些年，从黑铁时代到黄金时代再到白银时代 https://zhuanlan.zhihu.com/p/ 很多人现在抱着有超额回报期望来入行大模型Infra，在白银时代这个预期需要降低。能过踩中周期的注定是少数人，因为有分歧才有风险，有风险才有超额收益。 ——AI大模型时代的“卖铲人” 万字综述：全面梳理 FP8 训练和推理技术大模型Infra这些年，从黑铁时代到黄金时代再到白银时代 AI投资图谱：展望Infra百亿美金公司机遇（多图） LLMs推理技术栈
65710编辑于 2025-02-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

AI Infra论文阅读之LIGHTSEQ（LLM长文本训练的Infra工作）

AI Agent Infra领域的工具图谱

张量广播机制【Ai Infra 3.0】

VPP 测试框架之infra基础库测试

腾讯云Agent Infra解决方案概要

腾讯云 Agent Infra 解决方案技术概要

大模型最难的AI Infra，用Vibe Coding搞定

Infra 面试之数据结构五：顺序组装

腾讯云发布AI infra品牌“腾讯云智算”

HackMD 和 Obsidian 或许是智能体的Infra

拥抱 AI 范式革新：如何成为 AI Infra 核心专家

腾讯云 Agent Infra (智能体基础设施) 核心技术与架构解析

AI Infra论文阅读之《在LLM训练中减少激活值内存》

【企业级AI infra】IBM Vela系统：AI计算的革新之路

腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%

Agent规模化落地前夜，AI Infra的难题全都暴露了

开源公告｜AI-Infra-Guard(AI基础设施安全评估工具) 发布

又见供应链威胁：漏洞“INFRA：HALT ”影响数百家供应商的OT设备

AI Infra安全体系构建：应对大模型时代五大核心风险的纵深防御实践

DeepSeek开源周 Day02：从DeepEP开源趋势重新审视大模型Infra

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐