首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

学院在TPAMI顶刊发表论文

Amusi

近期,我院数据智能团队(DIG)在国际知名期刊IEEE Transactions on Pattern Analysis and Machine Intell...

400

YOLOv5模型训练流程说明

小单

YOLOv5 是一种常见的目标检测模型,在实际应用中,其训练过程通常涉及多个阶段,包括数据处理、模型训练与结果验证等环节。

6910

CVPR 2024计算机视觉技术研究指南

用户11764306

过去几年,基础模型和生成式AI模型(特别是大语言模型)已成为AI研究的主要课题。即使在计算机视觉领域也是如此,该领域越来越关注将大语言模型与图像编码器结合的视觉...

11510

视频模型的 GPT-3 时刻:谷歌 Veo 3 正在重新定义计算机视觉

不二小段

今天,我读到一篇 Google DeepMind 发表的论文,标题很直接,叫《视频模型是零样本学习者和推理者》(Video models are zero-sh...

10010

从图像到可编辑表格:智能识别技术实现与场景应用

中科逸视OCR专家

在企业数字化转型与政务智能化升级的进程中,表格作为核心数据载体,广泛存在于金融票据、政务表单、医疗报告、档案文献等各类场景中。传统 OCR 技术仅能实现文字提取...

13310

从非结构化到结构化:基于少样本学习的文档抽取系统架构与应用场景

中科逸视OCR专家

在企业的日常运营中,海量的非结构化文档——合同、订单、票据、法律文书、企业证照等承载着核心业务信息。然而,这些文档格式各异、布局多变,传统基于固定模板或规则引擎...

14810

Robin机器人感知系统与持续学习技术

用户11764306

过去,经典的计算机视觉算法会系统地将场景分割成单个元素,这是一种缓慢且计算量大的方法。监督式机器学习使这一过程更加高效。

10910

基于OpenCV的航天器自主对接算法原型

用户11764306

Chibuzor后来与另外两名实习生一起承担了这一具有挑战性的任务,他负责开发一种计算机视觉算法。

9810

无标签数据预测人脸识别模型偏差

用户11764306

近年来,算法偏差已成为跨AI学科研究的核心主题。2018年对人脸识别软件偏差的调查之后,该主题的关注度急剧上升——其中偏差被定义为不同人口统计群体中受试者的表现...

6710

视频分析平台实现程序监控与模仿学习

用户11764306

编者按: 本次采访是某机构科学部门发布的系列内容之一,旨在探讨某机构所投资公司产品与服务背后的科学原理。2019年,Alexa基金首次投资nflux.ai,并于...

8610

Ultralytics官宣 | 魔改已死,YOLO26即将发布

OpenCV学堂

培训创新:YOLO26 引入了MuSGD 优化器,它是SGD和Muon的混合体,灵感来自 Moonshot AI 在 LLM 训练中取得的Kimi K2突破。该...

31810

DINOv3视觉基础大模型正式发布!

OpenCV学堂

Meta 宣布发布 DINOv3,这是一个前沿的自监督视觉基础模型,在广泛的计算机视觉任务中实现了前所未有的性能。该模型通过放弃依赖于内存密集型带标签数据集的策...

25710

OpenCV4.10 DNN部署YOLO11全系模型

OpenCV学堂

YOLO11 是一个多功能的深度学习框架,支持多种计算机视觉任务。该框架可以用于对象检测、实例分割、OBB(定向边界框)、姿态估计等。每项任务都有不同的目标和应...

13410

Pytorch2.x实现四种经典卷积神经网络算子

OpenCV学堂

掌握这个四种经典的卷积网络算子,在计算机视觉任务中非常有用,从图像分类、图像分类、目标检测、实例分割、姿态评估、语义分割等模型中都有它们的身影。

8100

自主航天器对接的计算机视觉算法原型

用户11764306

在暑期研究项目中,参与了一个名为“CLING-ERS”的项目,目标是开发国际空间站的自主航天器对接解决方案。负责开发计算机视觉算法。

8000

基于 AI 与深度学习的银行卡识别系统解析

中科逸视OCR专家

银行卡识别技术,本质上是在计算机视觉与金融语义之间建立了一座高精度映射桥梁。通过将图像处理、深度学习序列识别与金融校验规则深度耦合,该技术不仅解决了复杂光照、形...

14810
领券