

发布时间:2026 年 6 月 6 日
谷歌在 I/O 接棒活动上正式发布 Gemini 3.0,这是首个将80% 推理负载移至端侧的旗舰多模态大模型。
指标 | 数据 |
|---|---|
本地推理占比 | 80%(日常查询) |
云端回退 | 20%(复杂推理/长上下文) |
多模态延迟 | <300ms(实时音视频翻译) |
参数量 | 未公开(推测 1.8T MoE,含 280B 激活) |
上下文窗口 | 4M tokens |
新组件 | Gemini Shield(端侧推理安全沙箱) |
技术要点:
意义:Gemini 3.0 标志着大模型推理正式脱离"云端依赖"。80/20 的分流策略意味着 90% 活跃用户每天 0 次云端调用,隐私红利与成本优势直接碾压竞品。
发布时间:2026 年 6 月 6 日
百度在 WAVE SUMMIT 2026 上发布 文心一言 5.0,以 1.2 万亿 MoE(Mixture-of-Experts)架构 成为目前公开参数规模最大的中文大模型。
指标 | 数据 |
|---|---|
总参数量 | 1.2 万亿(MoE) |
激活参数 | 180B(每个 token) |
专家数 | 256 |
中文基准(CLUE+) | 综合 93.7%,超越 GPT-4(92.1%) |
数学推理(MATH-zh) | 89.2%(vs GPT-4 86.5%) |
训练 Tokens | 18T |
训练算力 | 等效 20,000 PetaFlops/s-days |
训练集群 | 昆仑芯 3.0 × 16,000 卡 |
数据亮点:
行业影响:百度首次在中文能力维度明确超越 OpenAI 旗舰模型。"价格屠夫"策略将进一步压缩国内大模型 API 市场价格带。
发布时间:2026 年 6 月 6 日
英伟达 CEO 黄仁勋在 Computex 2026 主题演讲中正式揭晓 Rubin 架构 GPU,接替 Blackwell,基于台积电 2nm N2 工艺。
指标 | 数据 |
|---|---|
制程 | 台积电 2nm N2 |
FP8 算力 | 5 PFLOPS(单 GPU) |
FP16 算力 | 2.5 PFLOPS |
FP64 算力 | 156 TFLOPS |
显存 | 288GB HBM4(8-stack) |
显存带宽 | 8 TB/s |
晶体管数 | ~3200 亿 |
TDP | 1200W(风冷/液冷双模式) |
架构特点 | Tensor Core Gen6 + Transformer Engine 3.0 |
关键特性:
价格:Rubin GPU 定价 45,000–65,000,GB500 整柜报价
意义:算力密度较 H100 提升约 10 倍,功耗仅增加 50%(H100 700W → Rubin 1200W)。每瓦算力效率提升 6.7×,AI 训练成本将进入"暴跌曲线"。
发布时间:2026 年 6 月 6 日
台积电正式宣布 2nm(N2)工艺进入量产,首批良率达 85%,超过 N3 同期(80%)与 N5 同期(80%)。
指标 | 数据 | 对比 N3 |
|---|---|---|
节点 | N2 (2nm) | — |
良率 | 85% | N3: 80% |
逻辑密度 | 提升 15% | vs N3 |
速度增益 | 提升 12% | vs N3 |
功耗降低 | — | 降低 25~30% vs N3 |
SRAM 密度 | 38 Mb/mm² | vs N3 31 Mb/mm² |
首批客户 | 苹果、英伟达、AMD、高通、联发科 | |
月产能(2026 Q3) | 10 万片(12 英寸等效) |
工艺创新:
行业解读:85% 起步良率在全新节点上极为罕见,台积电执行能力再超预期。苹果 A20 与英伟达 Rubin 将成为首批 N2 主力产品。
发布时间:2026 年 6 月 7 日(WWDC 2026)
苹果正式发布 Apple Glasses,入局 AR 眼镜赛道。产品规格惊人地"轻量+高价"。
指标 | 数据 |
|---|---|
重量 | 85g(含镜片) |
芯片 | R2(自研 AR 专用 SoC) |
显示 | Micro-OLED(双目 4K,FOV 60°) |
续航 | 8 小时(连续使用) |
连接 | Wi-Fi 7 + Thread + UWB 2.0 |
传感器 | LiDAR + 12 目 SLAM + 眼动追踪 240Hz |
交互 | 手势 + 眼动 + 语音(Siri Pro) |
操作系统 | visionOS 3.0(精简版) |
定价 | $2,999 |
发售日 | 2026 年 9 月 15 日 |
核心技术:
对比竞品:
产品 | 重量 | 价格 | FOV | 续航 |
|---|---|---|---|---|
苹果 Apple Glasses | 85g | $2,999 | 60° | 8h |
Meta Orion | 98g | $1,499 | 50° | 4h |
Xreal Air 2 Ultra | 72g | $699 | 52° | 6h |
策略观察:苹果以 3 倍于 Meta 的价格入局,但凭借 R2 芯片生态 + visionOS 生态 构建硬件-内容-开发者飞轮。首发备货 500 万副,目标第一年出货 200 万。
发布时间:2026 年 6 月 7 日
华为与比亚迪联合发布 "璇玑"(Xuanji)智能座舱系统,深度整合鸿蒙座舱 5.0 与比亚迪的 L4 自动驾驶方案。
指标 | 数据 |
|---|---|
座舱系统 | 鸿蒙座舱 5.0 |
自动驾驶 | L4 级(城市+高速全域) |
芯片 | 昇腾 920(座舱)+ 昇腾 920P(自驾) |
传感器方案 | 3×LiDAR + 12×摄像头 + 8×毫米波 + 12×超声波 |
算力(自驾) | 1,200 TOPS |
屏幕 | 贯通式 45 英寸 8K Mini-LED |
AR-HUD | 70° FOV,10,000 尼特 |
语音助手 | 小艺 3.0 + 离线大模型 |
首发车型 | 比亚迪·仰望 U9L(2026 Q3) |
技术亮点:
定价:璇玑系统选装包 ¥68,000(含硬件升级 + 智驾订阅 5 年)。
行业思考:这是华为与比亚迪首次从硬件到 OS 到自驾的全栈深度整合。"璇玑"不仅是一个座舱,更是 "移动智慧空间" 的平台级定义——手机、家居、办公的全场景打通。
发布时间:2026 年 6 月 6 日(Sam Altman 直播)
OpenAI 发布 GPT-5 Preview,并非完整版发布,而是面向开发者与安全研究员的早期预览。
指标 | 数据 |
|---|---|
参数规模 | 未公开(传闻 10T+ MoE) |
上下文 | 传闻 16M tokens |
推理能力 | 在 GPQA Diamond 达 88.7%(vs GPT-4 63.2%) |
多模态 | 原生支持 文本 + 图像 + 音频 + 视频 |
编码(Codeforces) | Elo 2325(超越 99.5% 人类选手) |
新特性 | Active Reasoning(主动回溯推理) |
API 定价 | 传闻 $4/M tokens input / $12/M tokens output |
正式发布 | 2026 年 8 月(预计) |
核心看点:
关键限制:Preview 版本目前不支持图像生成(DALL-E 4 推迟),不支持函数调用,且每分钟请求限额极低(20 RPM)。完整版将在 8 月补齐。
领域 | 关键词 | 核心信号 |
|---|---|---|
AI 模型 | 端侧推理、万亿 MoE、Active Reasoning | 推理成本加速下降,端侧成为主战场 |
芯片/制程 | 2nm N2 量产、Rubin 5 PFLOPS | 算力密度 10× 跃升,台积电工艺遥遥领先 |
硬件终端 | Apple Glasses、璇玑座舱 | AI 从云端走入眼镜与汽车,载体全面爆发 |
竞争格局 | 中美博弈、价格战、全栈整合 | 科技公司从"做模型"转向"做系统做生态" |