首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大模型应用

    模型应用MiniLM实战案例:基于MiniLM模型的多语言智能客服问答检索系统.124

    示例结果分析基于all-MiniLM-L6-v2模型的结果分析说明: 正在下载/加载模型:sentence-transformers/all-MiniLM-L6-v2 正在构建知识库,共8条问答对 知识库构建完成 对比差异:这两张图直观的说明了:all-MiniLM-L6-v2模型仅做了同类词汇匹配,对语义理解缺失;paraphrase-multilingual-MiniLM-L12-v2能更好的适配中英双语的语义理解 对比差异:这两张图直观的说明了:all-MiniLM-L6-v2模型仅做了同类词汇匹配,对语义理解缺失;paraphrase-multilingual-MiniLM-L12-v2能更好的适配中英双语的语义理解 :这两张图直观的说明了:all-MiniLM-L6-v2模型未匹配到答案,但概率依旧50%的比例;paraphrase-multilingual-MiniLM-L12-v2能更好降低结果的匹配度; == 模型选择推荐在跨境多语言客服场景必须选择paraphrase-multilingual-MiniLM-L12-v2;纯英文客服场景优先选择all-MiniLM-L6-v2以获得更快的响应速度。

    10721编辑于 2026-06-01
  • 来自专栏大模型应用

    多语言文本嵌入模型解析:paraphrase-multilingual-MiniLM 与 all-MiniLM深度对比.123

    详细可参考:《构建AI智能体:大语言模型BERT:原理、应用结合日常场景实践全面解析》2.2 Sentence-BERT(SBERT) SBERT是BERT变体模型,专门针对句子嵌入优化。 2.3 MiniLM 模型MiniLM 是轻量级 BERT 变体,核心是通过模型压缩技术(知识蒸馏)在保持性能的前提下大幅减小模型体积、提升推理速度:层数压缩:仅保留BERT的部分Transformer (如手机、嵌入式设备)的 NLP 应用高并发的英文文本处理场景3. paraphrase-multilingual-MiniLM-L12-v2paraphrase-multilingual-MiniLM-L12 、应用实例1. 、推理速度慢、显存占用大、使用成本高的核心问题,MiniLM 模型可以作为大模型的轻量级替代方案,在大模型调用前作为大模型的前置处理模块,通常在实际应用中,MiniLM 常与大模型配合使用,形成 "轻量模型

    9211编辑于 2026-05-31
  • 来自专栏智能体

    智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化

    这篇文章继续优化,引入开源嵌入大模型all-MiniLM-L6-v2,并改造为先用大模型回答,再根据问题关键词从内部知识库查询问答结果。 一、嵌入大模型all-MiniLM-L6-v2介绍 all - MiniLM - L6 - v2 是一个轻量级的语言模型,在自然语言处理领域应用广泛。 该系列模型旨在通过知识蒸馏等技术,在保持较高性能的同时,减小模型规模,提高模型的运行效率和可部署性。 3.开发友好借助 sentence - transformers 库,仅需几行代码即可加载模型并生成句子嵌入,开发成本低,便于集成到各种应用中。 如需要可以使用更大参数的all-MiniLM-L12-v2等。不同的预训练模型在不同的任务和领域中可能表现不同,要根据具体需求选择合适的模型。后续可基于这个功能进行扩展和优化,敬请关注。

    92800编辑于 2025-06-24
  • 来自专栏老欧说安卓

    15天学会AI应用开发(八)使用向量数据库实现RAG功能

    一、文本嵌入Embedding模型 向量化一段文本的时候,经常用到all-MiniLM-L6-v2,它是一个轻量级的文本嵌入Embedding模型,专门把文字转成数字向量,给RAG做语义检索用。 命令行通过cd命令进入Python工程的所在目录,再执行下面的模型下载命令,可将all-MiniLM-L6-v2保存到本地目录: modelscope download --model sentence-transformers , "RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。" 对“FAISS是什么”),all-MiniLM-L6-v2模型结合FAISS也能正确识别出问题意图,并给出准确的回答。 本系列的AI应用开发文章目录为《15天学会AI应用开发全目录(零基础小白,零Token消耗)》。

    12810编辑于 2026-06-01
  • 来自专栏AI智能体从入门到实践

    构建AI智能体:构建本地化AI应用:基于ModelScope与向量数据库的文本向量化

    MiniLM: 指其基于 MiniLM 架构。这是一种通过知识蒸馏技术,将大型语言模型(如 BERT、RoBERTa)的知识压缩到更小模型中的方法。 体积: 模型文件大约 90 MB。 速度: 由于其小巧的尺寸,它在 CPU 和 GPU 上都能进行非常快速的推理(编码句子为向量),非常适合对延迟敏感的应用。 2. all-MiniLM-L6-v2 模型all-MiniLM-L6-v2 是 SentenceTransformers 库中的一个通用文本嵌入模型。 \all-MiniLM-L6-v2模型加载完成! ,适用于构建搜索引擎、推荐系统、文档去重等多种应用场景。

    86521编辑于 2025-11-08
  • 来自专栏老欧说安卓

    15天学会AI应用开发(九)利用Chroma持久化向量数据

    上一篇文章通过all-MiniLM-L6-v2模型结合FAISS实现了简单的RAG检索功能,但FAISS运行于内存中,无法持久化保存向量数据,重启后又得重新对文本做向量化,比较浪费算力资源。 三、结合all-MiniLM-L6-v2与Chroma实现RAG 接下来演示如何使用all-MiniLM-L6-v2与Chroma实现RAG检索功能。 , "RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。" 对“什么是AI”),all-MiniLM-L6-v2模型结合Chroma也能正确识别出问题意图,并给出准确的回答。 本系列的AI应用开发文章目录为《15天学会AI应用开发全目录(零基础小白,零Token消耗)》。

    7310编辑于 2026-06-04
  • 来自专栏周拱壹卒

    Vanna 离线环境部署

    基于 Flash 的 Web 应用[2] web-app 工作原理 how Vanna 的工作原理与通常的 RAG 原理类似,即: 先将数据库表的元数据信息、DDL 语句、SQL 查询问答对等信息向量化 Setup 安装依赖(可通过内网源或构建镜像): $ pip install 'vanna[chromadb,openai,mysql]' 准备向量嵌入模型文件,放至 ~/.cache/chroma/ onnx_models/all-MiniLM-L6-v2/onnx.tar.gz: $ wget https://chroma-onnx-models.s3.amazonaws.com/all-MiniLM-L6 plotly unsetunset相关资料 [1] Vanna: https://github.com/vanna-ai/vanna [2] Web 应用: https://vanna.ai/docs/ docs/web-app/#customization [9] Vanna Docs: Local: https://vanna.ai/docs/local.html [10] vanna+qwen实现私有模型

    4.1K10编辑于 2024-06-11
  • 来自专栏大内老A

    ASP.NET Core MVC应用模型的构建: 定制应用模型

    在对应用模型的基本构建方式具有大致的了解之后,我们来系统地认识一下描述应用模型的ApplicationModel类型。 认识这些接口有助于我们更好地理解应用模型的层次结构以及每种模型节点的用途。 ,而最初的元数据则来源于应用模型,所以有时候一些针对请求流程的控制需要间接地利用针对应用模型的定制来实现。 [1]: 应用的蓝图 ASP.NET Core MVC应用模型的构建[2]: 应用模型 ASP.NET Core MVC应用模型的构建[3]: Controller模型 ASP.NET Core MVC 应用模型的构建[4]: Action模型

    90810编辑于 2024-02-28
  • 来自专栏鸿蒙开发笔记

    鸿蒙应用开发-初见:入门知识、应用模型

    基础知识Stage模型应用程序包结构开发并打包完成后的App的程序包结构如图 开发者通过DevEco Studio把应用程序编译为一个或者多个.hap后缀的文件,即HAP一个应用中的.hap文件合在一起称为一个 区分的不同的系统cpu架构,例如arm平台、x86平台patch.json:用于描述hqf包版本信息的配置文件,由开发者填写快速修复包的发布部署流程Stage模型应用组件AbilityStage组件容器 FormExtensionAbility :FORM类型的ExtensionAbility组件,用于提供服务卡片场景相关能力ArkTS运行机制进程模型 Stage模型有三类进程,是从系统总体资源占用考虑 这个Render进程也是由系统负责创建和销毁基于HarmonyOS的进程模型,系统提供了 公共事件机制 用于一对多的通信场景,公共事件发布者可能存在多个订阅者同时接收事件线程模型ArkTS引擎实例的创建 线程模型 ArkTS引擎实例在主线程上创建。

    86510编辑于 2024-06-24
  • 模型应用开发实战

    至此最简单的模型应用开发完毕。 提供API支持 上面最简单的Hello world写完了,接下来就要为各种客户端提供接口服务了。. Net有WebAPI + IIS,java有spring boot+tomcat,大模型有FastAPI+Uvicorn:FastAPI 用于构建应用的业务逻辑,Uvicorn 是运行这些应用的服务器。 ,以创建更复杂的应用流程。 怎么着也得个应用程序APP之类,再不济也得有个Web吧!好吧,安排!为了搞大模型的人能安心研究模型,不用花精力在界面上。 最后 经过无数的蹂躏,我开发了个小应用【i歌词】,无任何条件免费提供全部源码。它基于chatglm4-9b大模型,从部署到训练,通用对话功能,核心根据歌名查歌词并创作歌词!

    1.3K36编辑于 2026-05-08
  • 来自专栏xiaosen

    LangChain大模型应用开发

    LangChain作为一个新兴的框架,旨在简化大模型应用的开发过程。它提供了一套工具和接口,帮助开发者将大模型无缝集成到各种应用场景中。 langchain:构成应用程序认知架构的链、代理和检索策略。 LangGraph:用于使用 LLM 构建健壮且有状态的多参与者应用程序。 搭建一个简单的LLM应用 我们使用 LangChain 构建的许多应用程序将包含多个步骤,其中包含多次调用 LLM 调用。 ,这对于获取数据作为模型推理的一部分进行推理的应用程序非常重要,例如检索增强生成或RAG。 HuggingFaceInferenceAPIEmbeddings( api_key=inference_api_key, model_name="sentence-transformers/all-MiniLM-l6

    61721编辑于 2024-12-04
  • 来自专栏xiaosen

    模型应用框架-LangChain

    LangChain自身并不开发LLMs,它的核心理念是为各种LLMs实现通用的接口,把LLMs相关的组件“链接”在一起,简化LLMs应用的开发难度,方便开发者快速地开发复杂的LLMs应用。 我们从两个方面全面介绍LangChain:一个是LangChain组件的基本概念和应用;另一个是LangChain常见的使用场景。 ://python.langchain.com/docs/integrations/text_embedding/huggingfacehub 2 LangChain主要组件 一个LangChain的应用是需要多个组件共同实现的 ,各种各样的模型不断出现,LangChain模型组件提供了与各种模型的集成,并为所有模型提供一个精简的统一接口。 因为大模型虽然非常强大,但是也具备一定的局限性,比如不能回答实时信息、处理数学逻辑问题仍然非常的初级等等。因此,可以借助第三方工具来辅助大模型应用

    1.3K10编辑于 2024-06-04
  • 来自专栏深度学习与python

    LangChain:简化大模型应用

    作者 | Guy Nesher 译者 | 平川 策划 | Tina LangChain 框架提供了常见用例的抽象,简化了大型语言模型(LLM)(如 OpenAI GPT4 或 Google PaLM)的应用。 通常,比较复杂的应用程序会使用多个组件来生成所需的结果。 我们将用 SimpleSequentialChain 做个演示,它会按顺序运行多个提示。 今日好文推荐 爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯 年薪超 600 万,比技术总监还高:电影行业 AI 产品经理的崛起 大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

    45330编辑于 2023-09-08
  • 来自专栏seth-shi的专栏

    Laravel 模型事件的应用

    Laravel在模型事件中处理起来很方便:https://laravel-china.org/docs/laravel/5.5/eloquent#events Laravel 的模型事件有两种方式, 设置dispatchesEvents属性映射事件类 使用观察器来注册事件,这里介绍第二种 新建模型 php artisan make:model Log <? 并新建基类LogBaseServer并在构造函数构建基本属性(CLI是因为在命令行执行时不存在用户执行) LogBaseServer 新建一个观察器继承基类LogBaseServer(User模型 (我这挺多的,之后大概长这样) 模型注册事件 然后我们触发一些事件(增删改,表的数据就有了) 事件 多对多的关联插入不会出触发模型(比如attach方法) 这时候就需要自己新建事件类来模拟 事件监听器PermissionRoleEventLog也继承基类LogBaseServer,这里就是根据传入的数组id遍历,然后创建日志 PermissionRoleEventLog 之后应用事件

    1.1K10编辑于 2023-12-18
  • 来自专栏DotNet NB && CloudNative

    Microsoft.Extensions.VectorData实现语义搜索

    Microsoft.Extensions.VectorData介绍 语义搜索正在改变应用程序查找和解释数据的方式,它专注于语义关联,而不仅仅是关键字匹配。 Microsoft.Extensions.VectorData 是一组 .NET代码库,旨在管理 .NET 应用程序中基于向量的数据。 模型 作为 Emedding生成器 ollama pull all-minilm Qdrant向量搜索引擎 Qdrant是一个向量相似性搜索引擎,它提供了一个生产就绪的服务,拥有便捷的 API来存储、 它非常适合需要高效相似性搜索的应用程序。我们可以在 Docker 容器中运行 它,这也使它成为对开发人员友好的选择。 初始化Embedding生成器:这里我们使用的是本地的Ollama运行all-minilm模型来做。

    42510编辑于 2025-04-10
  • 来自专栏数据拾光者

    广告行业中那些趣事系列60:详解超好用的无监督关键词提取算法Keybert

    最近调研到Keybert作为一种无监督学习的关键词抽取流程,效果不错,这里对Keybert进行调研并打算应用到广告场景中。 最早应用于文本摘要提取和信息检索等领域,在推荐场景下体现在给用户推荐相关商品的同时,保证推荐结果的多样性,即排序结果存在着相关性与多样性的权衡。 -v2”,在0.6.0版本模型是“all-MiniLM-L6-v2”。 如果需要高质量并且性能好的模型可以使用“paraphrase-mpnet-base-v2”;如果是英文场景则可以使用“paraphrase-MiniLM-L6-v2”;如果是多语言场景则可以使用“paraphrase-multilingual-MiniLM-L12 use_maxsum的效果奇差); 找出效率和效果均比较优秀的模型paraphrase-multilingual-MiniLM-L12-v2。

    2.6K20编辑于 2023-03-08
  • 来自专栏云原生工具箱

    应用为中心:开放应用模型(OAM)初探

    如今,已有无数的应用以容器的形式运行在各种版本 Kubernetes 中了。 应用管理之惑 然而我们慢慢发现,随着应用和服务数量、使用场景以及承载业务的增加,Kubernetes 资源越来越难以管理。 而开放应用模型(OAM)可能是助我脱离苦海的一味良药。 开放应用模型(OAM) OAM 是阿里云与 Azure 在 2019 年末联合推出的标准化云原生应用管理模型。 所谓 “应用模型”,其实是一个专门用来对云原生应用本身和它所需运维能力进行定义与描述的标准开源规范。 而通过 “定义应用” 和 “组织管理应用的运维能力” 这两大核心功能,我们可以构建一个更容易管理、维护和发展的云原生平台。 应用结构 结语 通过上面这个简单的示例,可以看出如果遵循 OAM 模型来划分应用,我们可以从 ApplicationConfiguration 入手,看到应用中都包含哪些组件(Component),同时又可以看到每个组件都有哪些运维特性

    2.6K10发布于 2020-12-30
  • 来自专栏鸿蒙开发笔记

    HarmonyOSOpenHarmony应用开发-Stage模型应用组件级配置

    在开发应用时,需要配置应用的一些标签,例如应用的包名、图标等标识特征的属性。本文描述了在开发应用需要配置的一些关键标签。 应用图标和标签是在设置应用中使用,例如设置应用中的应用列表。入口图标是应用安装完成后在设备桌面上显示出来的,如图一所示。 图1 应用图标和标签1.应用包名配置应用需要在工程的AppScope目录下的app.json5配置文件中配置bundleName标签,该标签用于标识应用的唯一性。 2.应用图标和标签配置Stage模型应用需要配置应用图标和应用标签。应用图标和标签是在设置应用中使用,例如设置应用中的应用列表,会显示出对应的图标和标签。 "icon": "$media:app_icon", "label": "$string:app_name" // ... } }3.入口图标和标签配置Stage模型支持对组件配置入口图标和入口标签

    57110编辑于 2024-06-27
  • 来自专栏大模型应用

    模型应用:隐私优先的大模型应用:同态加密与大模型结合的完整实践.101

    今天我们就由浅入深拆解“同态加密 + 大模型”的完整体系,覆盖核心概念、基础原理、执行流程和实际落地,整体还是比较复杂和麻烦的,我们借此多了解一些核心概念和基础,在需要的时候再深入研究加以应用,尽量通俗的梳理 同态加密+大模型的价值 在传统的大模型推理流程中,用户需要将明文数据(如隐私问答、敏感文档)传输给大模型服务商,服务商在明文数据上完成推理后返回结果。 同态加密 + 大模型的核心价值:在保护数据隐私的前提下,无损利用大模型的智能能力。2. 应用场景分析5.1 隐私数据问答场景:银行利用大模型分析用户的加密交易数据,回答“该用户是否符合贷款条件”。 将密文输入到适配后的大模型:加密后的密文被输入到经过特殊适配的大模型中,模型能够直接处理密文数据5.

    26731编辑于 2026-05-09
  • 来自专栏大模型应用

    模型应用:大模型时代的XGBoost:传统梯度提升树与大模型的协同应用.103

    一、前言 在人工智能技术体系中,XGBoost作为经典的梯度提升树模型,凭借高效的特征学习能力和优秀的结构化数据处理性能,长期占据机器学习应用的核心地位;而大模型则以其强大的语义理解、上下文建模和通用推理能力 XGBoost 与大模型融合的全链路知识,深度了解其核心原理和应用实践。 XGBoost 与大模型结合2.1 大模型的核心痛点尽管大模型能力强大,但在实际应用中存在明显短板:1. 模型保存:将训练好的 XGBoost 模型保存为文件,如 JSON/PMML 格式,方便后续部署。步骤 6:模型评估与部署1. 传统模型和大模型不是替代关系,而是协同关系。以前总觉得大模型很高大上,传统模型过时了,现在才明白,能落地、能解决实际问题的组合才是最好的。

    22321编辑于 2026-05-11
领券