介于篇幅原因,这篇文章只读一下这篇paper,把握一下核心的Infra相关的idea。这篇paper应该还没有中会议,处于openreview阶段。
因此我才会在前面介绍智能体基础架构的文章中断言道:Agent Infra是Agent落地的关键!因为它涵盖了Agent从开发到部署的完整生命周期。 目前在Agent Infra层面,可以大致划分为这四个赛道:Environment、Context、Tools、Agent Security。 下面是我查阅很多资料后整理的Agent Infra工具图谱,供大家参考。
当对张量执行逐元素操作(如加法、减法或乘法)时,它们的形状通常需要对齐。但是,手动调整或重复张量以匹配形状可能会很繁琐且效率低下,尤其是在处理大型数据集时。PyTorch 通过一种称为**广播(broadcasting)**的机制解决了这个问题。
该系列文章有4篇:VPP 测试框架之官方文档解读VPP 测试框架之使用示例及参数说明VPP Bond单元测试源码分析Vpp 测试框架之infra基础库测试(本文)本文已同步至:个人博客:itwakeup.com 微信公众号:vpp与dpdk研习社(vpp_dpdk_lab)1. infra单元测试在src/vppinfra/test/目录下,有许多通过REGISTER_TEST注册的单元测试,用于对vppinfra 编译 test_infra执行make build生成可执行文件test_infra1.2. 运行参数说明test_infra运行参数说明:perf:携带该参数将运行性能测试,默认为功能测试。 /build-root/build-vpp_debug-native/vpp/bin/test_infra filter toeplitzMultiarch Variant: default------ /build-root/build-vpp_debug-native/vpp/bin/test_infra perfWarming up...Multiarch Variant: default----
一、产品定位与核心亮点 技术定义:Agent Infra(智能体基础设施)解决方案,核心为Agent Runtime,集成AI运行时(执行引擎)、云沙箱、安全可观测等核心模块。 商业差异化卖点:为智能体提供稳定、安全、可弹性伸缩的运行环境,将开发团队从复杂底层基础设施(Infra)问题中解放,专注Agent本身创新。
一、产品定位与核心亮点 腾讯云 Agent Infra(智能体基础设施)解决方案——Agent Runtime,是为AI智能体(Agent)提供的专用运行环境。
然而,当我们目光转向实际的系统,特别是 AI Infra 这种复杂系统时,Vibe Coding 就会常常会陷入「水土不服」的困境。 总结下来,主要有这三个方面的问题。 而这些问题背后的根源在于:AI Infra 到底还是个复杂系统,动辄数万行代码、成百上千个相互关联的决策点,而当前的对话式编程缺乏持久化、结构化的决策管理机制。 换句话说,Vibe 本身是模糊且不稳定的,无法支撑严肃复杂的 Infra。 不过 Vibe Coding 的发展不可逆,其广泛应用的潜力不应就此止步。 要让 Vibe Coding 真正适用于 AI Infra 开发,我们实践了文本驱动的 Vibe Coding 方法:通过设计文档将所有关键决策体系化、持久化。 AI Infra 中的资源调度系统,尤其是面向 Agentic RL,正是这样一个理想试验场。该系统是数万行代码的分布式训练系统,面临 GPU 利用率优化的复杂挑战,涉及核心调度逻辑改动。
参考资料 [1] 系统日知录: https://xiaobot.net/p/system-thinking [2] infra 程序员面试题目大全: https://github.com/DistSysCorp /infra-interview/tree/main/data_structures
9月5日,在腾讯全球数字生态大会上,腾讯云正式发布AI infra品牌“腾讯云智算”。
在大模型、多模态与智能体技术爆发的今天,AI Infra 正从 “支撑算力供给” 的幕后角色,走向 “定义智能生产方式” 的核心舞台。 在这样的浪潮中,AI Infra 专家的价值被重新定义 —— 他们不仅是算力的管理者,更是智能系统的架构师、效率的革新者与业务的赋能者。 一、AI Infra 的范式革新:从 “算力供给” 到 “智能生产”过去,AI Infra 的核心目标是 “让模型训得更快”。 二、AI Infra 核心专家的全栈技术栈要成为 AI Infra 核心专家,必须构建覆盖 “硬件 - 分布式 - 框架 - 工程化 - 架构设计” 的全栈能力。1. 行业标准:参与制定 AI Infra 标准、开源贡献、技术布道。业务赋能:理解业务场景,设计最优 AI Infra 方案,支撑智能体、多模态、世界模型等新应用。
一、 产品定位与核心亮点 腾讯云 Agent Infra(Agent Runtime)是一款专为 AI Agent(智能体)设计的底层基础设施解决方案(当前执行引擎与云沙箱组件处于开放内测阶段)。
0x4.2.3 Pipline并行 GPipe->1F1B Pipline并行可以读我之前写的这篇paper解读:AI Infra论文阅读之将流水线并行气泡几乎降到零(附基于Meagtron-LM的ZB-H1
AI工作负载 对 Infra 的要求 幻灯片描述了AI工作负载的不同阶段(数据准备、分布式训练、模型调优、推理)以及每个阶段所需的基础设施类型和时间要求。
腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。 目前,HPC-Ops 已在 github 开放源码供开发者下载使用,同时腾讯混元infra团队也表示,欢迎行业内的技术实践者提交高价值 PR,参与算子边缘场景优化、教程案例打磨等精准化贡献,共同推动大模型推理技术的边界拓展
InfoQ 特别邀请 IDC 高级研究经理张犁、智诊科技产品总监罗龙生、腾讯云异构计算高级产品经理黄阳,解析 AI Infra 的六大核心能力、Agent 规模化的结构性难题、AI Infra 价值闭环衡量标准 IDC 总结出了 AI Infra 应具备的六个关键模块: 异构算力调度能力:针对当前算力多元化的发展趋势,AI Infra 通过算力调度技术和平台,实现对异构算力芯片的深度适配和统一纳管,能够根据不同业务场景进行高效的算力选型 AI Infra 的风险和成本控制 明确了衡量 AI Infra 能力的宏观框架,实际落地过程中,企业还需要用可量化的方式,判断 AI Infra 在具体业务场景的价值。 他指出,企业的集中需求,正促使整个 AI Infra 行业都在朝着更灵活、更智能的方向发展。 AI Infra 下一阶段的竞争逻辑 随着 Agent 在行业中加速落地,AI Infra 的竞争开始从“比技术”走向“比业务价值”。
安装与使用 ● 安装 下载地址: https://github.com/Tencent/AI-Infra-Guard/releases ● 使用 单个目标 . /ai-infra-guard -target [IP/域名] 多个目标 ./ai-infra-guard -target [IP/域名] -target [IP/域名] 从文件读取 . /ai-infra-guard -file target.txt AI分析 . /ai-infra-guard -target [IP/域名] -ai -token [混元token] 指纹匹配规则 AI Infra Guard 基于WEB指纹识别组件,指纹规则在data/fingerprints 项目地址 Github地址:https://github.com/Tencent/AI-Infra-Guard 请给项目 一个 Star ! 欢迎提出你的 issue 和 PR!
Forescout和JFrog Security研究人员在NicheStack中发现的14个漏洞被统称为“INFRA:HALT”,允许远程代码执行、拒绝服务、信息泄漏、TCP 欺骗和DNS缓存中毒。 INFRA:NicheStack中的HALT漏洞 在过去的两年里,来自多家公司的研究人员亲自探索物联网、OT和嵌入式设备/系统中使用的各种TCP/IP堆栈的安全性,并记录了他们的发现。
剖析行业战略困境与核心瓶颈 AI技术变革推动2026年金融行业全面迈入大模型应用阶段,传统IT基础设施向AI Infra演进,攻击面急剧扩大。
/ 关于大模型Infra思考 LLM Infra 简介 LLM Infra(大语言模型基础设施,LLM Infrastructure)是 LLM 实践和应用的底座。 LLM AI Infra广义上包含了基础模型和基础软件栈两层,本篇报告核心关注其中和工作流相关的基础软件工具栈。 LLM Infra从业建议 在知乎看到一篇非常有意思的文章,分享给大家: 大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 https://zhuanlan.zhihu.com/p/ 很多人现在抱着有超额回报期望来入行大模型Infra,在白银时代这个预期需要降低。能过踩中周期的注定是少数人,因为有分歧才有风险,有风险才有超额收益。 ——AI大模型时代的“卖铲人” 万字综述:全面梳理 FP8 训练和推理技术 大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 AI投资图谱:展望Infra百亿美金公司机遇(多图) LLMs推理技术栈