首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏圆圆的算法笔记

    基于树的稠密检索模型

    今天介绍的这篇文章由清华大学和华为联合发表,核心是提升向量检索的效果,在树检索的基础上,实现了索引构建和表示学习的联合建模,提升了树检索的一致性。 Dense retrieval将query和document分别编码成向量,可以使用TwinBERT等类似的双塔模型拟合rank loss,得到query和document的向量。 对于一个query向量,在树中做层次检索,每层只选打分topK的节点,进入下一层匹配,下一层匹配只和上一层topK的节点的子节点进行匹配,按照这个逻辑递归进行(也即Beam Search,基于贪心的策略 2、现有树检索的问题 现有的树检索模型,一般采用两阶段的方式:第一阶段训练query-document的双塔模型,拿到query和document的向量;第二阶段基于第一阶段训练好的向量,通过聚类算法构建层次树 为了解决这个问题,本文提出了一种的稠密向量学习+树索引构造的学习方式,实现了更高效的树稠密检索架构。 3、训练 本文将Encoder训练和树学习融合到一起学习,新的流程如下图所示。

    71020编辑于 2023-08-17
  • 来自专栏PaddlePaddle

    ”思想

    深度学习基础理论-CNN篇 “”思想 深度学习的一个重要思想即“”的学习方式(end-to-end manner),属表示学习(representation learning)的一种。 对此,深度学习则为我们提供了另一种范式(paradigm)即“”学习方式,整个学习流程并不进行人为的子问题划分,而是完全交给深度学习模型直接学习从原始输入到期望输出的映射。 相比分治策略,“”的学习方式具有协同增效的优势,有更大可能获得全局最优解。 图 卷积神经网络基本流程图 如上图所示,对深度模型而言,其输入数据是未经任何人为加工的原始样本形式,后续则是堆叠在输入层上的众多操作层。 这些操作层整体可看作一个复杂的函数f(cnn),最终损失函数由数据损失(date loss)和模型参数的正则化损失(regularizationloss)共同组成,深度模型的训练则在最终损失驱动下对模型进行参数更新并将误差反向传播至网络各层

    1.8K70发布于 2018-04-24
  • 来自专栏AIoT技术交流、分享

    智能驾驶大模型,你知道吗?

    2023年12月,特斯拉推出FSD V12,首次搭载智驾大模型。 2024年至今,小鹏、华为、理想、蔚来等主机厂相继升级至智能驾驶架构。 One Model生成式一体化 (世界模型):采用单一神经网络模型,将传统自动驾驶系统中的感知、预测、决策、规划等多模块整合为一体。 例如,小鹏汽车作为国内首家实现模型量产的车企,应用模型后,其版本迭代速度明显加快,推送周期由此前的约4个月缩短至约2个月。 同时,新增功能的落地速度和覆盖的场景也在加速。 我们认为,的数据驱动升级模式大大降低了人工规则编写的需求,使得版本迭代与性能提升更加迅速。 随着模型不断优化,智能驾驶系统的稳定性与智能水平将持续提升。 而端方案通过将多个模块整合为一个大模型,减少了系统的复杂性和冗余,优化了资源配置。 组织架构精简:架构不再需要多个独立的团队来分别开发感知和决策模块。

    1.7K10编辑于 2025-02-07
  • 来自专栏老张的求知思考世界

    漫谈测试

    从我的角度来看,所谓测试,通俗理解就是从一另一完整串联起来的测试方法。当然,由于是漫谈,我会尝试通过对几个与测试有关的问题思考,来聊这个话题。什么是测试? 至于测试的步骤,与常规的测试流程并无太大区别,都是从需求分析开始,线上交付结束。当然,测试并非是特别新颖和独特的测试方法,早在16、17年,业内就有了类似的测试思路,如业务流、数据流。 测试的优势与不足上面提到了测试的难度相比于传统的测试方法更大,主要体现在业务和系统的复杂性会让测试的实施成本随之水涨船高。 要设计测试用例,就要提前梳理对应的业务流程和数据模型;要执行测试用例,就需要确保该链路的通畅性;同时还要完善的监控覆盖,以及保障测试执行环境的稳定性(这是最大的影响测试结果的因素)。 今年以来各种技术大模型开始涌现,借助AI大模型的能力,在业务场景和数据模型梳理以及用例完善方面,也许能获得一定的助力。当然,如何实践还需要自己亲自去尝试,找到适合自己的方法。

    82410编辑于 2024-08-21
  • 来自专栏PaddlePaddle

    【命名实体识别】训练的序列标注模型

    本周推文目录如下: 3.12:【命名实体识别】 训练的序列标注模型 3.13:【序列到序列学习】 无注意力机制的神经机器翻译 3.14:【序列到序列学习】 使用Scheduled Sampling 在序列标注任务中,我们以命名实体识别(Named Entity Recognition,NER)任务为例,介绍如何训练一个的序列标注模型。 【命名实体识别】 训练的序列标注模型 以下是本例的简要目录结构及说明: . ├── data # 存储运行本例所依赖的数据 │ ├── download.sh 使用神经网络模型解决问题的思路通常是:前层网络学习输入的特征表示,网络的最后一层在特征基础上完成最终的任务;对于序列标注问题,通常:使用基于RNN的网络结构学习特征,将学习的特征接入CRF完成序列标注 ,转换为实向量表示的词向量序列; 将步骤2中的2个词向量序列作为双向RNN的输入,学习输入序列的特征表示,得到新的特性表示序列; CRF以步骤3中模型学习的特征为输入,以标记序列为监督信号,实现序列标注

    2.7K80发布于 2018-03-15
  • 来自专栏美团无人配送

    【美团技术解析】无人车驾驶模型概述

    驾驶模型的发展历程 寻找驾驶模型的最早尝试,至少可以追溯1989年的ALVINN模型【2】。 作为对比,模型以其简单、易用、成本低、拟人化等特点表现出很强的优势。 人们通常认为驾驶模型和模块化的传统模型之间是彼此对立的,有了模块化模型就不需要端端了。 使模型的部署成为可能。然后,模型可以很好地处理常见场景,而且功耗低。模块化的方法能覆盖更多场景,但功耗高。因此,一个很有价值的方向应该是联合部署模型和模块化模型。 3、驾驶模型很难恰当地处理长尾场景。 对于常见场景,我们很容易通过数据驱动的方式教会模型正确的处理方法。但真实路况千差万别,我们无法采集所有场景的数据。 此外,迁移学习、对抗学习、元学习等技术高速发展,或许也会对驾驶模型产生巨大影响。 我对驾驶模型今后的发展充满了期待。

    1.4K30发布于 2019-04-26
  • 来自专栏GiantPandaCV

    nndeploy - 一款开源的模型部署框架

    nndeploy - 一款开源的模型部署框架 本文首发于GiantPandaCV,欢迎转载。 old_photo 2 概述 nndeploy是一款模型部署框架。 :将 AI 算法(前处理->推理->后处理)的部署抽象为有向无环图 Graph,前处理为一个 Node,推理也为一个 Node,后处理也为一个 Node。 可直接操作推理框架内部分配的输入输出,实现前后处理的零拷贝,提升模型部署的性能。 线程池:提高模型部署的并发性能和资源利用率(thread pool)。 3 架构简介 nndeploy是以多端推理以及基于有向无环图模型部署为内核的模型部署框架。故架构简介从多端推理以及基于有向无环图模型部署两个为引子去介绍整体架构。

    1.5K10编辑于 2024-04-12
  • 来自专栏大数据智能实战

    谷歌tacotron的文本转语音合成模型实践

    A Fully End-to-End Text-To-Speech Synthesis Model》论文对应的摘要可以看出:   一个文本转语音的合成系统通常需要多个处理阶段,例如文本分析前端、声学模型和音频合成模块 该论文提出了 Tacotron——一种的生成式文本转语音模型,可以直接从字符合成语音。通过<text, audio>配对数据集的训练,该模型可以完全从随机初始化从头开始训练。 可见其本质上是Seq2Seq的一种应用,该模型接收字符的输入,输出相应的原始频谱图,然后将其提供给 Griffin-Lim 重建算法以生成语音 2、论文实践 注:本测试过程中,需要将一整句英文的标点符号进行去除

    1.4K10发布于 2019-05-28
  • 来自专栏小鹏的专栏

    10 语音识别

    语音识别 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? • Espnet: https://github.com/espnet/espnet • 实现了主流的语音识别方法 • Speech-Transformer、LAS、CTC、RNN-T • 一个小缺点

    1.9K20发布于 2020-03-25
  • 来自专栏CKL的思考空间

    需求交付管理

    一直以来,作为研发人员,我们关注的都是研发任务的交付(从需求澄清到需求交付),很少有人会去关注需求本身是否给产品或者企业带来多少真正的价值(如激活了多少存量用户、吸引了多少新用户等等)。 今天我们跳出研发的角色,聊一聊需求的交付管理。 上图直观的反映了当下交付需求的不确定性。往常,我们只需要根据合同或者行业成熟的解决方案,定期交付我们的产品,然后按合同收款即可。 敏捷中有一个名词叫MVP(Minimum Viable Product最小可行产品),如上图,用户的需求是需要一辆车,图一呢,就是从车轮子车底盘车架到完整的汽车的过程,在这个交付过程中呢我们的车都是不可用的 ,再来看第二幅图,从一个滑板滑板车自行车摩托车再到汽车,在这个交付过程中的每个阶段,我们都有车可用。 因为客户的需求可能并不是一辆车,他也许只是想从A地B地转一圈。下图其实就是一个经典的需求不对称。是不是很熟悉。

    84720编辑于 2023-02-01
  • 来自专栏不能显示专栏创建者

    自主的测试

    机器学习在测试中的核心优势是能够利用高度复杂的产品分析数据来识别和预测用户需求。

    70000发布于 2020-12-14
  • 来自专栏CRM日记本

    到底指什么?

    1 初步认识 首先我们看下MBA智库里对的解释: “流程是从客户需求端出发,满足客户需求端去,提供服务,的输入是市场,输出也是市场。 为了打通交付流程,最大程度满足客户需求,公司正在全球范围内推行,一时之间成为当年华为热门词汇。 ? 还是任总讲话通俗易懂,就是解决流程断头的问题,简单一句话点出了要解决的问题关键。 3 如何解决 我们还是回到前面的定义的第一句话,“流程是从客户需求端出发,满足客户需求端去”,这句话怎么理解? 有的小伙伴会问,的流程建立起来了,但是大家都是平行部门,谁来负责整个流程的推动?

    17.3K51发布于 2019-10-25
  • 来自专栏从流域到海域

    的深度学习

    的深度学习 有些数据处理系统,或者机器学习系统需要多个阶段的处理。的深度学习,做的是用单个深度神经网络(一般情况下)去替代多个阶段的处理过程。 ? 如上图,传统的语音识别大致包括四个步骤,而的深度学习直接接收声音输入,然后完成听译过程。 它目前面临的其中一个挑战是,你可能需要大量的数据才能使它运行得很好。 而关于直接从图片映射到人的身份这个数据集可能只有很小的一部分数据,在该情况下端的深度学习不能取得更好的效果。 下面是2个正面的例子。 ? 学习的优缺点 ? 优点: 让数据说话 不需要手动设计组件 缺点: 可能需要大量的数据 排除了可能是有用的手动设计组件 什么时候使用的深度网络 ? 如图:一个正例,一个反例。 而人脸识别这个例子,人脸位置识别和身份识别两个组件就十分恰当,所以才能得到优于学习的效果。 所以组件的合理性和完备性及其适用性也是我们去考虑要不要舍弃去进行学习的一个考量。

    1.2K20发布于 2019-05-26
  • 来自专栏陈哥聊测试

    什么是测试?

    不知道大家有没有听过测试?每个软件都应该进行测试,以确保其按规定运行。这种测试方法建立了对系统的信心,并帮助开发团队确定软件是否已准备好进行生产部署。 在本文,我给大家简单分享一下测试是什么,为什么它很重要,以及如何在软件项目中有效地实现它。1.先搞懂,什么是测试? 一般情况下,测试会在功能测试、系统测试之后,软件的主要版本发布前完成。大家可以按照70/20/10来划分,也就是70%的单元测试、20%的集成测试和10%的测试。 2.测试的不同阶段我把测试拆为三个阶段:规划、测试、收尾,接下来我们会逐一了解这些阶段。 测试可以手动执行,也可以在CI/CD中使用自动化执行。比较推荐自动化执行测试,因为这会为测试团队节省了时间和精力,同时确保在最短的时间内获得高质量的结果。

    33110编辑于 2025-11-12
  • 来自专栏程序员阿常

    需求交付管理

    以下文章来源于CKL的思考空间 ,作者CKL的思考 一直以来,作为研发人员,我们关注的都是研发任务的交付(从需求澄清到需求交付),很少有人会去关注需求本身是否给产品或者企业带来多少真正的价值( 今天我们跳出研发的角色,聊一聊需求的交付管理。 上图直观的反映了当下交付需求的不确定性。往常,我们只需要根据合同或者行业成熟的解决方案,定期交付我们的产品,然后按合同收款即可。 敏捷中有一个名词叫MVP(Minimum Viable Product最小可行产品),如上图,用户的需求是需要一辆车,图一呢,就是从车轮子车底盘车架到完整的汽车的过程,在这个交付过程中呢我们的车都是不可用的 ,再来看第二幅图,从一个滑板滑板车自行车摩托车再到汽车,在这个交付过程中的每个阶段,我们都有车可用。 因为客户的需求可能并不是一辆车,他也许只是想从A地B地转一圈。下图其实就是一个经典的需求不对称。是不是很熟悉。

    1.1K20编辑于 2022-09-01
  • 来自专栏我爱计算机视觉

    最强文本识别模型

    场景文本的识别可以用文本检测+文本识别两个过程来做,近年来的场景文本识别(即Text Spotting)越来越引起学术界的重视,而华中科技大学白翔老师组的 Mask TextSpotter v1、 之前的文本识别模型使用包围文本的矩形框作为Proposals,在应对旋转、形状任意和极端纵横比的文本时存在明显的缺陷。 这里既找到了文本区域,又有了每个文本区域对应的特征,作者按照Mask TextSpotter v2 的流程进行识别,使用Fast R-CNN算法,字符分割模块和空间注意力模型都被用于识别。 以下为在ROIC13数据集上在检测任务和识别任务中的结果比较,大幅超越之前的SOTA: ? 以下为在MSRA-TD500数据集上在检测任务中的结果: ? 总结与思考 Mask TextSpotter v3 在文本识别任务中实现了更高的精度,得益于从分割中获得文本多边形区域表示和Hard ROI masking 特征提精方法。

    1.5K10发布于 2020-08-17
  • 来自专栏AI科技大本营的专栏

    利用 AssemblyAI 在 PyTorch 中建立的语音识别模型

    AssemblyAI使用Comet记录、可视化和了解模型开发流程。 深度学习通过引入模型改变了语音识别的规则。这些模型接收音频,并直接输出转录。 目前最流行的两种模型是百度的Deep Speech和谷歌的Listen Attend Spell(LAS)。 如何在PyTorch中构建自己的语音识别模型 让我们逐一介绍如何在PyTorch中构建自己的语音识别模型。 该模型为输出字符的概率矩阵,我们将使用该矩阵将其输入解码器中,提取模型认为是概率最高的字符。 CTC损失功能–将音频与文本对齐 我们的模型将接受训练,预测输入模型中的声谱图中每一帧(即时间步长)字母表中所有字符的概率分布。 ?

    1.8K20发布于 2020-06-16
  • 来自专栏数据派THU

    CVPR 2022|南大开源MixFormer:目标检测新模型

    知乎 来源丨https://zhuanlan.zhihu.com/p/485189978 本文介绍一下我们在单目标跟踪(VOT)领域的新工作 MixFormer——基于 transformer 的简洁的模型 而即使这些基于 transformer 的模型依然依赖于 CNN 来提取特征,受限于全局建模的能力,使得这些模型并没有在 tracking pipeline 中完全发挥出 self-attention MixFormer是一个模型,所以没有任何框后处理操作。 此外,我们采用了一种非对称式混合attention:删去了从 target(模板) search (搜索区域)的 query ,这样做既是为了避免目标模板被动态的搜索区域影响,更重要的是能提高跟踪效率 总结 MixFormer革新了传统的跟踪范式,统一了特征提取和目标融合模块,既简化了模型也提升了跟踪的性能,希望我们的研究能够进一步推进视觉跟踪领域的研究。

    1.8K10编辑于 2022-04-18
  • 语音翻译系统结合ASR与印度语大模型

    语音翻译系统结合序列到序列自动语音识别模型与印度语大语言模型本文介绍了针对IWSLT 2025印度语赛道的语音文本翻译系统,专注于英语-印度语及印度语-英语的双向翻译任务。 为提升低资源场景下的翻译质量,提出了一种集成预训练Whisper自动语音识别(ASR)模型与印度语专用大语言模型(LLM)Krutrim的系统。 实验结果表明,该系统在英语印度语方向取得了平均BLEU分数数学处理错误,在印度语英语方向取得了平均BLEU分数数学处理错误。 尽管该方法在成功解析的输出中显示出显著提升翻译质量的潜力(例如泰米尔语英语的BLE分数提高了数学处理错误),但观察模型在持续遵循所需CoT输出格式方面存在挑战。 技术细节: 使用预训练Whisper模型处理语音输入 集成Krutrim大语言模型进行文本翻译优化 针对低资源语言对设计 pipeline 评估指标采用BLEU分数,并分析CoT方法的效果与局限性提交信息

    19600编辑于 2025-08-23
  • 来自专栏FunTester

    敏捷中的测试

    测试与传统测试 传统测试包括单元测试、集成测试、系统测试、验收测试。但是测试是在系统测试之后开始的。有时系统/单元/集成测试与测试之间区别不大,有时候很难界定,但是这些完全不同。 但是测试将具有从搜索付款(带有新添加的付款选项)以及订单确认的场景。测试的范围,复杂性和维护性高于单元和集成测试。 谁进行测试 测试应由对应用程序有深入了解并了解产品架构的测试人员执行。除了测试人员外,业务人员、营销人员、内测用户甚至技术经理都是进行测试的理想人选。 测试步骤 这些是测试必不可少的步骤: 需求分析:全面分析需求,并涵盖工作流程中的主要业务组件。 环境设置:设置测试环境时要牢记生产环境的详细信息。 一旦开始测试,就可以在高风险的用户场景下同时运行冒烟和健全性测试。 提高端测试效率 尝试以最大的覆盖范围自动化测试用例。 将自动化套件与冒烟测试、健全性测试和验收测试分开。

    2.1K30发布于 2020-09-27
领券