计算机视觉 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签计算机视觉

#计算机视觉

RK3576/Orin + Gemini335 机器人视觉专题（二）从 Depth 图到目标距离：不用 YOLO，先用 fake bbox 跑通测距

用户12610749 1天前2026-07-09 15:01:46

等这条链路跑通后，下一篇只需要把 fake bbox 替换成 YOLO 检测出来的真实 bbox。

5710

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

用户12610749 1天前2026-07-09 14:27:57

很多人从传统视频、安防、FPV 图传、嵌入式视觉开发转到机器人视觉时，都会遇到一个共性问题：

4910

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

用户12610749 1天前2026-07-09 14:27:57

很多人从传统视频、安防、FPV 图传、嵌入式视觉开发转到机器人视觉时，都会遇到一个共性问题：

4910

《Image Generators are Generalist Vision Learners》深度解读：当“生成”开始取代“识别”，计算机视觉正在进入世界模型时代

heidsoft 8天前2026-07-02 11:00:22

论文地址： arXiv 原文：https://arxiv.org/html/2604.20329v2

14210

Python 3.13降级到3.11：一次d2l库安装的踩坑与解决全记录

AI重构职业生涯探索 16天前2026-06-24 00:46:10

最近我在跟随bibi博主李沐学习深度学习时，遇到了一个典型但又令人头疼的问题：在Python 3.13.13环境下安装d2l库时，反复出现各种版本兼容性错误，...

12400

融合“身份证识别+活体检测+数据比对”的人脸核身技术，赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

中科逸视OCR专家 22天前2026-06-18 17:15:32

人脸核身技术并非简单的图像比对，而是一套融合了计算机视觉、深度学习与生物特征识别的复杂系统工程。其核心原理可概括为以下三个关键环节：

35310

【开源项目推荐】这个ai追踪系统让视觉跟踪变得如此简单！

小开 ALSKai 24天前2026-06-16 17:50:19

SAMURAI是一个创新的计算机视觉追踪系统，它基于Meta最新发布的SAM 2（Segment Anything Model）模型开发。该系统通过结合运动感知...

11900

大模型自训练与分布式训练技术前沿

用户11764306 2026-06-092026-06-09 08:06:36

AI驱动的研发可能是整个AI领域最重要的事情，因为它帮助我们理解AI系统最终能否构建自己的后继者。到目前为止，AI研发的焦点大多集中在支持AI开发的组件（如AI...

14310

2022年十大热门计算机技术论文盘点

用户11764306 2026-06-072026-06-07 14:06:28

2013年，某云服务商通过推出某机构 Redshift 彻底改变了数据仓库行业，这是第一个完全托管、PB级、企业级的云数据仓库。某机构 Redshift 使得利...

12910

基于Transformer和自监督学习的食谱检索技术

用户11764306 2026-06-052026-06-05 15:13:10

在寻找烹饪创意时，人们常常从社交媒体和餐厅中获得灵感，保存喜欢的食物截图或照片。某机构已经构建了一项技术，让人们能够利用这些图像来查找对应的烹饪食谱。在2021...

11210

ECCV 2022：某机构计算机视觉研究全景

用户11764306 2026-06-052026-06-05 11:21:18

研究主题涵盖从视觉异常检测到道路网络提取，从带回归约束的神经架构搜索到面向视频表征的自监督学习。

12810

#计算机视觉

RK3576/Orin + Gemini335 机器人视觉专题（二）从 Depth 图到目标距离：不用 YOLO，先用 fake bbox 跑通测距

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

《Image Generators are Generalist Vision Learners》深度解读：当“生成”开始取代“识别”，计算机视觉正在进入世界模型时代

Python 3.13降级到3.11：一次d2l库安装的踩坑与解决全记录

融合“身份证识别+活体检测+数据比对”的人脸核身技术，赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

【开源项目推荐】这个ai追踪系统让视觉跟踪变得如此简单！

大模型自训练与分布式训练技术前沿

2022年十大热门计算机技术论文盘点

基于Transformer和自监督学习的食谱检索技术

ECCV 2022：某机构计算机视觉研究全景

热门专栏

TEG云端专业号的专栏

AI科技大本营的专栏

量子位

数据派THU

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#计算机视觉

RK3576/Orin + Gemini335 机器人视觉专题（二） 从 Depth 图到目标距离：不用 YOLO，先用 fake bbox 跑通测距

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

从视频检测到机器人视觉 RK3576 / Orin + Gemini335 + YOLO 机器人视觉开发合集导读

《Image Generators are Generalist Vision Learners》深度解读：当“生成”开始取代“识别”，计算机视觉正在进入世界模型时代

Python 3.13降级到3.11：一次d2l库安装的踩坑与解决全记录

融合“身份证识别+活体检测+数据比对”的人脸核身技术，赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

【开源项目推荐】这个ai追踪系统让视觉跟踪变得如此简单！

大模型自训练与分布式训练技术前沿

2022年十大热门计算机技术论文盘点

基于Transformer和自监督学习的食谱检索技术

ECCV 2022：某机构计算机视觉研究全景

TEG云端专业号的专栏

AI科技大本营的专栏

量子位

数据派THU

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

RK3576/Orin + Gemini335 机器人视觉专题（二）从 Depth 图到目标距离：不用 YOLO，先用 fake bbox 跑通测距