首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >科技硬核周报 | 2026.06.07:七大重磅发布,AI与算力全面爆发

科技硬核周报 | 2026.06.07:七大重磅发布,AI与算力全面爆发

作者头像
小博测试成长之路
发布2026-06-08 10:54:38
发布2026-06-08 10:54:38
350
举报
文章被收录于专栏:软件测试学习软件测试学习
封面
封面


一、🤖 谷歌 Gemini 3.0:80% 查询本地推理,端侧 AI 的分水岭

发布时间:2026 年 6 月 6 日

谷歌在 I/O 接棒活动上正式发布 Gemini 3.0,这是首个将80% 推理负载移至端侧的旗舰多模态大模型。

指标

数据

本地推理占比

80%(日常查询)

云端回退

20%(复杂推理/长上下文)

多模态延迟

<300ms(实时音视频翻译)

参数量

未公开(推测 1.8T MoE,含 280B 激活)

上下文窗口

4M tokens

新组件

Gemini Shield(端侧推理安全沙箱)

技术要点

  • 本地推理引擎:基于 TensorSoC Gen3 专用 NPU,功耗仅 5W,可在 Pixel 11 上运行 70B 级模型。
  • 实时多模态翻译:支持 127 种语言,视频通话中逐帧 OCR + 口型同步翻译,延迟比 Gemini 2.0 降低 78%。
  • Gemini Shield:硬件级安全隔离,数据不出设备;企业版支持私有化部署 + 联邦微调。

意义:Gemini 3.0 标志着大模型推理正式脱离"云端依赖"。80/20 的分流策略意味着 90% 活跃用户每天 0 次云端调用,隐私红利与成本优势直接碾压竞品。


二、🇨🇳 百度文心一言 5.0:1.2 万亿 MoE,中文能力反超 GPT-4

发布时间:2026 年 6 月 6 日

百度在 WAVE SUMMIT 2026 上发布 文心一言 5.0,以 1.2 万亿 MoE(Mixture-of-Experts)架构 成为目前公开参数规模最大的中文大模型。

指标

数据

总参数量

1.2 万亿(MoE)

激活参数

180B(每个 token)

专家数

256

中文基准(CLUE+)

综合 93.7%,超越 GPT-4(92.1%)

数学推理(MATH-zh)

89.2%(vs GPT-4 86.5%)

训练 Tokens

18T

训练算力

等效 20,000 PetaFlops/s-days

训练集群

昆仑芯 3.0 × 16,000 卡

数据亮点

  • 中文能力跃迁:在 CLUE+、C-Eval、CMRC 三大中文基准上全面领先 GPT-4,差幅 1.6~4.2 个百分点
  • MoE 高效性:1.2T 总参数下仅激活 180B,推理成本仅为同等稠密模型的 1/6。
  • 应用层:同步发布 ERNIE-Bot Pro 5.0 API,定价 ¥0.08/千 tokens,仅为 GPT-4-turbo 的 1/20。

行业影响:百度首次在中文能力维度明确超越 OpenAI 旗舰模型。"价格屠夫"策略将进一步压缩国内大模型 API 市场价格带。


三、🟢 英伟达 Rubin 架构 GPU:2nm 工艺,5 PFLOPS FP8

发布时间:2026 年 6 月 6 日

英伟达 CEO 黄仁勋在 Computex 2026 主题演讲中正式揭晓 Rubin 架构 GPU,接替 Blackwell,基于台积电 2nm N2 工艺。

指标

数据

制程

台积电 2nm N2

FP8 算力

5 PFLOPS(单 GPU)

FP16 算力

2.5 PFLOPS

FP64 算力

156 TFLOPS

显存

288GB HBM4(8-stack)

显存带宽

8 TB/s

晶体管数

~3200 亿

TDP

1200W(风冷/液冷双模式)

架构特点

Tensor Core Gen6 + Transformer Engine 3.0

关键特性

  • Rubin Ultra 配置:双晶粒封装,FP8 算力达 10 PFLOPS,显存 576GB。
  • NVLink 7:双向带宽 2.4 TB/s,支持 576 GPU 互联。
  • Grace Rubin 超级芯片:CPU+GPU 统一内存池,带宽达 1.2 TB/s。
  • GB500 算力集群:Grace Rubin × 4 + Rubin Ultra × 8,单机柜 FP8 算力 82 PFLOPS

价格:Rubin GPU 定价 45,000–65,000,GB500 整柜报价

意义:算力密度较 H100 提升约 10 倍,功耗仅增加 50%(H100 700W → Rubin 1200W)。每瓦算力效率提升 6.7×,AI 训练成本将进入"暴跌曲线"。


四、🔬 台积电 2nm N2 量产:良率 85%,超越预期

发布时间:2026 年 6 月 6 日

台积电正式宣布 2nm(N2)工艺进入量产,首批良率达 85%,超过 N3 同期(80%)与 N5 同期(80%)。

指标

数据

对比 N3

节点

N2 (2nm)

良率

85%

N3: 80%

逻辑密度

提升 15%

vs N3

速度增益

提升 12%

vs N3

功耗降低

降低 25~30% vs N3

SRAM 密度

38 Mb/mm²

vs N3 31 Mb/mm²

首批客户

苹果、英伟达、AMD、高通、联发科

月产能(2026 Q3)

10 万片(12 英寸等效)

工艺创新

  • NanoFlex Pro:第二代 GAA(Gate-All-Around)纳米片晶体管,片宽可调,混合 Vt 设计。
  • 背面供电网络(Backside Power Delivery):显著降低 IR Drop,提升高频性能。
  • 2026 年底规划 N2P 增强版,性能再提 7%。

行业解读:85% 起步良率在全新节点上极为罕见,台积电执行能力再超预期。苹果 A20 与英伟达 Rubin 将成为首批 N2 主力产品。


五、👓 苹果 Apple Glasses AR 眼镜:85g,R2 芯片,$2999

发布时间:2026 年 6 月 7 日(WWDC 2026)

苹果正式发布 Apple Glasses,入局 AR 眼镜赛道。产品规格惊人地"轻量+高价"。

指标

数据

重量

85g(含镜片)

芯片

R2(自研 AR 专用 SoC)

显示

Micro-OLED(双目 4K,FOV 60°)

续航

8 小时(连续使用)

连接

Wi-Fi 7 + Thread + UWB 2.0

传感器

LiDAR + 12 目 SLAM + 眼动追踪 240Hz

交互

手势 + 眼动 + 语音(Siri Pro)

操作系统

visionOS 3.0(精简版)

定价

$2,999

发售日

2026 年 9 月 15 日

核心技术

  • R2 芯片:3nm 制程,集成 NPU(45 TOPS)与 AR 协处理器,功耗仅 1.8W。
  • 光学方案:偏振波导 + 全息光栅,透光率 >80%,目视无数字重影。
  • 数字孪生底座:实时扫描建模环境 Mesh,延迟 <10ms。
  • 续航:85g 下实现 8h 续航,电池采用堆叠式锂聚合物 + 无线充电底座。

对比竞品

产品

重量

价格

FOV

续航

苹果 Apple Glasses

85g

$2,999

60°

8h

Meta Orion

98g

$1,499

50°

4h

Xreal Air 2 Ultra

72g

$699

52°

6h

策略观察:苹果以 3 倍于 Meta 的价格入局,但凭借 R2 芯片生态 + visionOS 生态 构建硬件-内容-开发者飞轮。首发备货 500 万副,目标第一年出货 200 万。


六、🚗 华为 × 比亚迪"璇玑"智能座舱:鸿蒙座舱 5.0 + L4 自驾

发布时间:2026 年 6 月 7 日

华为与比亚迪联合发布 "璇玑"(Xuanji)智能座舱系统,深度整合鸿蒙座舱 5.0 与比亚迪的 L4 自动驾驶方案。

指标

数据

座舱系统

鸿蒙座舱 5.0

自动驾驶

L4 级(城市+高速全域)

芯片

昇腾 920(座舱)+ 昇腾 920P(自驾)

传感器方案

3×LiDAR + 12×摄像头 + 8×毫米波 + 12×超声波

算力(自驾)

1,200 TOPS

屏幕

贯通式 45 英寸 8K Mini-LED

AR-HUD

70° FOV,10,000 尼特

语音助手

小艺 3.0 + 离线大模型

首发车型

比亚迪·仰望 U9L(2026 Q3)

技术亮点

  • 端云一体大模型:昇腾 920 集成 NPU 可运行 70B 参数的离线座舱大模型,响应 <200ms。
  • 璇玑感知融合:BEV + Transformer 端到端,无高精地图依赖,复杂路口通过率 99.7%。
  • V2X 协同:华为"星闪"近场通信,车-车延迟 <1ms,支持编队行驶。
  • 智驾安全:L4 级冗余系统(双昇腾 920P + 双 IMU + 双电源),单点失效可降级至 L3 继续运行。

定价:璇玑系统选装包 ¥68,000(含硬件升级 + 智驾订阅 5 年)。

行业思考:这是华为与比亚迪首次从硬件到 OS 到自驾的全栈深度整合。"璇玑"不仅是一个座舱,更是 "移动智慧空间" 的平台级定义——手机、家居、办公的全场景打通。


七、🔮 OpenAI GPT-5 Preview:能力跃迁,细节待揭

发布时间:2026 年 6 月 6 日(Sam Altman 直播)

OpenAI 发布 GPT-5 Preview,并非完整版发布,而是面向开发者与安全研究员的早期预览。

指标

数据

参数规模

未公开(传闻 10T+ MoE)

上下文

传闻 16M tokens

推理能力

在 GPQA Diamond 达 88.7%(vs GPT-4 63.2%)

多模态

原生支持 文本 + 图像 + 音频 + 视频

编码(Codeforces)

Elo 2325(超越 99.5% 人类选手)

新特性

Active Reasoning(主动回溯推理)

API 定价

传闻 $4/M tokens input / $12/M tokens output

正式发布

2026 年 8 月(预计)

核心看点

  • Active Reasoning:模型可自主判断推理路径是否正确,必要时回溯并重试——类似人类"再想想"。在 MATH 基准上带来 18% 的相对提升。
  • 16M 上下文:若属实,是 GPT-4 的 16 倍,可处理整部《三体》三部曲 + 分析报告。
  • 价格:如果 4/12 属实,较 GPT-4o 涨价约 40%,但性能提升幅度远超成本增幅。

关键限制:Preview 版本目前不支持图像生成(DALL-E 4 推迟),不支持函数调用,且每分钟请求限额极低(20 RPM)。完整版将在 8 月补齐。


📊 本周总览:算力密度 × 端侧智能 × 生态聚合

领域

关键词

核心信号

AI 模型

端侧推理、万亿 MoE、Active Reasoning

推理成本加速下降,端侧成为主战场

芯片/制程

2nm N2 量产、Rubin 5 PFLOPS

算力密度 10× 跃升,台积电工艺遥遥领先

硬件终端

Apple Glasses、璇玑座舱

AI 从云端走入眼镜与汽车,载体全面爆发

竞争格局

中美博弈、价格战、全栈整合

科技公司从"做模型"转向"做系统做生态"


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小博测试成长之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、🤖 谷歌 Gemini 3.0:80% 查询本地推理,端侧 AI 的分水岭
  • 二、🇨🇳 百度文心一言 5.0:1.2 万亿 MoE,中文能力反超 GPT-4
  • 三、🟢 英伟达 Rubin 架构 GPU:2nm 工艺,5 PFLOPS FP8
  • 四、🔬 台积电 2nm N2 量产:良率 85%,超越预期
  • 五、👓 苹果 Apple Glasses AR 眼镜:85g,R2 芯片,$2999
  • 六、🚗 华为 × 比亚迪"璇玑"智能座舱:鸿蒙座舱 5.0 + L4 自驾
  • 七、🔮 OpenAI GPT-5 Preview:能力跃迁,细节待揭
  • 📊 本周总览:算力密度 × 端侧智能 × 生态聚合
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档