数据集是由文件元信息和特征所组成的集合,是存放文件元数据索引的容器。创建数据集后,智能检索 MetaInsight 可以自动解析在对象存储 COS 中文件的基础信息,并对图片进行智能分析,提取特征建立元数据索引。例如在电商场景中,您创建一个电商图库数据集,通过绑定存储桶与数据集接口将某个存储桶与数据集进行绑定,或通过创建元数据索引接口,为后续产生的电商商品图片建立元数据索引,然后使用图片检索功能,用户可以通过自然语言或相似商品图对电商图库中的图片进行检索。具体操作请参见 数据集管理控制台指南。
说明:
在创建数据集时,可以为数据集设置检索模板(Template),检索模板定义了数据集创建元数据索引时需要执行的算子操作,不同的算子将提取不同类型的元数据,详情请参见 检索模板与算子。
创建数据集后,您可以为存储在对象存储 COS 中的文件建立元数据索引。通过丰富的元数据索引,智能检索可以为您提供强大的数据聚合查询、分析和管理能力。提供了两种建立元数据索引的方式:
方式一:绑定 COS 存储桶与数据集,自动建立元数据索引,绑定存储桶后,智能检索会先扫描桶内存量数据,当存量数据索引完成后,会继续扫描桶内新增的文件并建立索引,详情请参见 数据集管理控制台指南。
方式二:通过接口手动建立元数据索引,详情请参见 创建元数据索引。
元数据索引建立完成后,您可以在控制台或通过 API 接口进行基础文件信息查询、以图搜图、以文搜图、人脸搜索等操作,详情请参见 简单查询、图像检索、人脸搜索、文档检索。