首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Python进阶之路

    开源教育对话模型 EduChat

    EduChat 是华东师范大学计算机科学与技术学院的 EduNLP 团队开发的开源教育对话模型。 该项目主要研究以预训练大模型为基底的教育对话模型相关技术,融合多样化的教育垂直领域数据,辅以指令微调、价值观对齐等方法,提供教育场景下自动出题、作业批改、情感支持、课程辅导、高考咨询等丰富功能,服务于广大老师 - EduChat是一个由华东师范大学开发的对话式语言模型。 EduChat的工具 - Web search: Disable. - Calculators: Disable. 模型回复可能存在偏见,有可能生成危险性言论。 在某些场景中,比如推理、代码、多轮对话等方面,模型的能力仍有待提高。 ---- ️ 参考链接: EduChat - 探索了针对教育垂直领域的对话模型相关项目研发 EduChat 模型 - 在 educhat-base-002-7b 基础上,使用构建的教育领域多技能数据微调后得到

    1.9K30编辑于 2023-07-10
  • Alexa对话式AI技术进展解析

    Alexa对话式AI技术进展在疫情期间,团队持续创新,为对话式AI系统带来了多项技术突破。 为让开发者轻松构建对话技能,发布了Alexa Conversations功能。 开发者只需提供API、技能中调用的实体类型列表以及少量示例对话,基于深度学习的对话管理器就能预测客户可能与技能交互的多种方式。 新系统使用隐式反馈为NLU模型创建自动标记的训练示例,特别适用于异常表述请求的长尾分布。 这些技术进步正在通过实际功能为客户带来价值,同时推动整个对话式AI领域的发展。

    32210编辑于 2025-10-12
  • 模型对话风险统计评估框架

    你的大语言模型有多灾难性?——面向对话风险的统计认证框架随着大语言模型在各领域的应用日益广泛,保障其安全性的重要性也随之提升。 提出的方法称为C3LLM(认证大语言模型中的灾难性对话风险)框架,将基准测试的重点从经验抽查转向统计认证。该框架从查询集开始,构建一个图,其中边连接语义相似的查询。 对每个采样序列查询大语言模型,使用评判模型确定响应是否有害,并聚合结果计算灾难性风险概率的统计认证界限。对话建模方法为了构建框架,首先需要对对话(即"多轮对话")进行建模。 对于最高水平的恶意行为者能力,近似对抗性引导,即恶意行为者诱导大语言模型产生有害输出。为此,自适应采样,检查基于图的对话中的先前移动,以映射到最终产生有害输出的查询的距离。 图提供了创建多轮对话提示集(特定查询序列)的能力,可以在目标大语言模型上运行。然后使用独立的基于ChatGPT的评判机制标记大语言模型的响应为灾难性或非灾难性,判断模型响应是否有害。

    10410编辑于 2026-05-15
  • 来自专栏数据派THU

    中文对话模型BELLE全面开源!

    来源:高能AI本文约1000字,建议阅读5分钟模型调优仅使用由ChatGPT生成的数据,为中文指令提供更好的支持。 中文对话模型开源社区迎来了一名浓眉大眼的新成员! 但是这样的技术不应该只被掌握在一家公司手中,因此BELLE项目应运而生了,他们的初衷是为了促进中文对话模型开源社区的发展。为此,他们在三个方面做了初步的尝试,并已经开源了他们的研究成果。 模型:大模型的训练往往具有较高的成本,而一个具备初步的能力的对话模型,将大大降低使用和科研的门槛。为此,他们基于Bloom和LLAMA,训练了出具效果的对话模型,并完全开放了这些模型的参数。 轻量化:为了便于模型的部署和试用,BELLE团队同时开源了对话模型的量化版本。包括8bit, 4bit, 其中4bit版本模型checkpoint大小仅为6.9G,运行仅需8.4G显存。 总结 可以说BELLE的出现,大大促进了中文开源对话模型的发展,基于他们开源的数据和模型,更多的人可以尝试这些模型,更多的研究工作可以更快捷的展开。

    1K20编辑于 2023-04-05
  • 来自专栏PaddlePaddle

    飞桨对话模型工具箱(二):对话自动评估模块ADE

    为了帮助广大开发者们更快捷地实现对话系统的开发,飞桨在自然语言处理模型库(PaddleNLP)中开源了对话模型工具库,内置了对话通用理解模型(DGU)和对话自动评估模块(ADE)。 在上一篇文章中,我们已经为大家介绍了对话通用理解模型(DGU)。在本篇文章中,将为大家介绍对话自动评估模块(ADE)。 1. 模型介绍 飞桨对话自动评估模块(ADE),主要用于评估开放领域对话系统的回复质量。 它的输入是文本对(上文,回复),输出是回复质量得分。 利用少量标注数据(特定对话系统或场景的人工打分),在匹配模型基础上进行微调,可以显著提高该对话系统或场景的评估效果。 :使用spearman相关系数来衡量评估模型对系统的打分与实际对话系统打分之间的关系; seq2seq_naive:使用spearman相关系数来衡量评估模型对系统的打分与实际对话系统打分之间的关系;

    1K30发布于 2019-11-01
  • 来自专栏软件测试学习

    基于LangChain的大模型对话简单demo

    LangChain Python 提供了一个庞大的生态系统,拥有 1000 多个集成,涵盖聊天与嵌入模型、工具与工具包、文档加载器、向量存储等。 docs.langchain.com/oss/python/integrations/providers/overview 现在看一下怎么通过python脚本使用langchain-deepseek连接deepseek模型进行对话 运行方式 deepseek-chat:走「非思考模式」——像常规大模型一样“秒回”,适合日常对话、创意写作、客服问答。 的Chat models LangChain 支持通过统一的接口,从任意支持的模型提供商进行初始化聊天模型。 : 总结 看完上面的内容的话,基本上就可以写一个简单的基于langchain的大模型基础对话的简单脚本了,关注我,后面会不定期更新其他内容。

    75310编辑于 2025-11-12
  • 来自专栏机器学习AI算法工程

    【开源】度小满中文金融对话模型

    人工评测 除在各榜单进行评测外,我们进一步对XuanYuan-6B-Chat模型进行了人工评估,来公正客观地评估chat模型对话场景中的真实能力。 XuanYuan-6B基座模型、chat模型及其量化模型的使用方法和XuanYuan-70B,XuanYuan2-70B类似,但是tokenizer加载方式和在对话场景中使用的prompt格式不同(不包含 主要特点: “以小搏大”的对话能力:在知识理解、创造、分析和对话能力上,可与千亿级别的模型相媲美 金融领域专家:在预训练和微调阶段均融入大量金融数据,大幅提升金融领域专业能力。 在金融知识理解、金融业务分析、金融内容创作、金融客服对话几大方面展示出远超一般通用模型的优异表现 人类偏好对齐:通过人类反馈的强化学习(RLHF)训练,在通用领域和金融领域均与人类偏好进行对齐 模型训练与创新 在模型训练中,团队在模型预训练阶段动态调整不同语种与领域知识的比例,融入了大量的专业金融语料,并在指令微调中灵活运用之前提出的Self-QA和混合训练方法,显著提升了模型对话中的性能表现。

    80410编辑于 2024-04-18
  • 来自专栏代码编写世界

    连接语言大模型(LLM)服务进行对话

    引言 最近开始接触AI大模型方向的工作,第一个实例就尝试一下连接大模型进行对话的实现。 2. 这也是为啥现在大模型平台都可以选择接入不同的大模型来实现AI应用。 就是大模型的提示词,通过更改提示词,可以与大模型对话来得到自己想要的结果。 2.2 LangChain 除了使用openai模块,使用LangChain是个更好的选择。 当然,如果有的大模型提供batch接口,LangChain就会直接调用它。 2.3 其他 在阿里的百炼平台上还提供了“多轮对话”和“流式输出”的使用方式。这两种方式是构建AI Chat应用必须的。 “多轮对话”就是需要让大模型记住之前的对话内容,也就是上下文,以便得到更好的输出;“流式输出”则是让大模型的回答逐步渐进的输出,一个字一个字的呈现,以便让AI Chat应用的交互性更好。

    43610编辑于 2025-07-21
  • 来自专栏机器学习与统计学

    命令行中与大模型对话

    大家好,我是老章推荐一个有意思的可以在命令行与大模型对话的Python库 虽然各种code CLI工具很多,但是也不是什么问题都要去找Claude Code、Gemini CLI、Qwen Code这些烧钱的大家伙 LLM LLM 是一款功能强大的命令行工具和 Python 库,可与 OpenAI、Anthropic 的 Claude、Google 的 Gemini、Meta 的 Llama 等众多大语言模型进行交互 ,支持通过远程 API 及在本地安装运行模型。 chat 与模型进行持续对话 collections 查看和管理嵌入集合 embed 对文本进行嵌入并存储或返回结果 embed-models 管理可用的嵌入模型 embed-multi 一次性为多个字符串存储嵌入...

    69610编辑于 2025-07-26
  • 来自专栏github@hornhuang

    Android-弹窗AlterDialog对话框使用解析

    主要方法: setMessage() 设置对话框内容为简单文本 setItems() 对话款内容为简单列表项 setSingleChoiceItems() 对话框内容为单选列表项 setMultiChoiceItems () 对话款内容为多选列表项 setAdapter() 内容为自定义列表项 setView() 内容为自定义view ---- 六种样式分析: 显示消息提示的对话框(例如:是否确认关闭) 简单列表对话框 单选列表对话框 多选列表对话框 自定义对标对话框 自定义View对话框 注:按钮的点击事件在 MainActivity 中声明 MainActivity的 XML 在文末给出 一、显示消息提示的对话框 builder = new AlertDialog.Builder(MainActivity.mMainActivity) .setTitle("你好呀~")//设置对话框 void send(View source){ FirstService.simple(getWindow().getDecorView()); } } ---- 二、列表项对话

    2.3K10发布于 2021-09-24
  • 来自专栏数据派THU

    ChatGPT 与世界:对话式 AI 模型对比

    作为一种人工智能语言模型,ChatGPT 已经成为自然语言处理领域最流行、最有效的工具之一。不过,值得注意的是,ChatGPT 并不是唯一一个 AI 语言模型。 这几年,还出现了许多其他的模型,每个竞争对手都提供了独到的功能和优点。本文简单介绍了 ChatGPT 的竞争对手中最突出的几个模型。 本文最初发布于 Analytics Vidhya。 简介 作为一种人工智能语言模型,ChatGPT 已经成为自然语言处理领域最流行、最有效的工具之一。不过,值得注意的是,ChatGPT 并不是唯一一个 AI 语言模型。 这几年,还出现了许多其他的模型,每个竞争对手都提供了独到的功能和优点。以下是 ChatGPT 的竞争对手中几个最突出的模型。 它是一个分布式的机器学习框架,可以在多台机器上训练大型模型。这有助于开发更复杂、更先进的语言模型

    57910编辑于 2023-05-11
  • 来自专栏github@hornhuang

    Android-对话框Dialog风格、样式解析

    简介: 对话框的主要类型: AlterDialog 功能最丰富应用最广泛 ProgressDialog 进度对话框,对进度条进行了包装 DatePickerDialog 日期选择对话框,对DatePicker 进行了包装 TimePickerDialog 时间选择对话框对TimePicker进行了包装 AlterDialog: https://blog.csdn.net/qq_43377749/article /details/85035693 对话风格窗口: https://blog.csdn.net/qq_43377749/article/details/85037821 使用PopupWindow: https://blog.csdn.net/qq_43377749/article/details/85038117 DatePickerDialog、TimePickerDialog 时间日期对话框 : https://blog.csdn.net/qq_43377749/article/details/85038563 ProgressDialog进度对话框: https://blog.csdn.net

    86620发布于 2021-09-24
  • 来自专栏#推荐系统及推荐算法

    什么是大模型多轮对话式推荐?如何维护对话上下文?

    本文将带你了解:大模型如何做多轮对话式推荐?对话上下文是怎么维护的?以及这背后的技术原理和工程实践。 二、什么是大模型多轮对话式推荐大模型多轮对话式推荐,是指利用大语言模型的理解和生成能力,通过与用户进行多轮自然语言对话,逐步收集和澄清用户偏好,最终给出个性化推荐结果的系统。 三、大模型对话式推荐如何工作3.1为什么大模型适合做这件事大模型具备三个关键能力,让它成为对话式推荐的理想选择:1.语义理解能力能听懂用户的口语化、主观化表达。 3.3维护对话上下文的技术方案方案一:Prompt拼接(最直接)原理:每次调用模型时,把历史对话按时间顺序拼接到输入里。 方案三:状态总结(更智能)原理:让模型定期把对话状态提炼成结构化信息。

    31110编辑于 2026-04-11
  • 来自专栏云云众生s

    与数据对话:大型语言模型正在改变AIOps

    利用大型语言模型简化数据库查询,并从可观测性数据中获取可操作的见解。 大型语言模型 (LLM) 是这个故事的最新篇章,也许是迄今为止所有 AI 开发中最引人注目的。公众第一次直接在日常生活中与 AI 模型互动,让更多人能够围绕这项强大技术的全新应用进行构思。 从命令到对话:语音助手与 LLM 在许多方面,像苹果的 Siri、亚马逊的 Alexa 和谷歌助手这样的语音助手传统上都有其局限性。作为用户,您只能使用一组特定的问题或命令,并且必须以特定的方式表达。 它们还可以跟踪对话中的上下文,并允许您修改提示或澄清陈述。这些功能带来了更加自然和舒适的沟通方式,更类似于人类彼此之间的沟通方式。难怪语音助手开始实施 LLM! 例如,如果用户查询过去五天的指标,并希望获得过去十分钟的相同指标,则模型应记住先前的查询详细信息并相应地调整时间范围。

    41710编辑于 2024-08-25
  • 来自专栏王磊的博客

    面试官:如何实现大模型连续对话

    所有的大模型本身是不进行信息存储的,也不提供连续对话功能,所以想要实现连续对话功能需要开发者自己写代码才能实现。那怎么才能实现大模型的连续对话功能呢? 大模型连续对话功能不同的框架实现也是不同的,以行业使用最多的 Java AI 框架 Spring AI 和 Spring AI Alibaba 为例,给大家演示一下它们连续对话是如何实现的。 1.SpringAI连续对话实现 Spring AI 以 MySQL 数据库为例,我们来实现一下它的连续对话功能。 PS:我们只有先讲对话存储起来,才能实现连续对话功能,所以我们需要借助数据库存储来连续对话。 Spring AI Alibaba 连续对话的实现就简单很多了,因为它内置了 MySQL 和 Redis 的连续对话存储方式,接下来以 Redis 为例演示 SAA 的连续对话实现,它的实现步骤如下:

    62610编辑于 2025-07-19
  • 来自专栏DrugOne

    DialoGPT:大规模预训练的对话响应模型

    本文介绍了一种大规模、可调整的神经对话响应生成模型DialoGPT(dialogue generative pre-trained transformer),模型在从2005年至2017年Reddit评论链中提取的 人类对话包含了两个对话者的竞争目标,潜在的响应(回复)更加多样化。因此,相比于其他文本生成的任务,对话模型提出了一个更大的一对多的任务。 并且人类的对话通常也不正式,经常包含缩写或错误,这些都是对话生成的挑战。 过滤后的数据集包含了147, 116, 725条对话实例,总共18亿个单词。 3 方法 3.1 模型架构 作者在GTP-2架构的基础上训练DialoGPT模型。 作者参考OpenAI GPT-2将多轮会话作为长文本,将生成任务作为语言模型。首先,作者把一次会话中的所有对话合并为一个长文本,以文本结束符作为结尾。

    3.3K40发布于 2021-02-01
  • 来自专栏Java技术进阶

    书生·浦语大模型图文对话Demo搭建

    前言 本节我们先来搭建几个Demo来感受一下书生浦语大模型 InternLM-Chat-7B 智能对话 Demo 我们将使用 InternStudio 中的 A100(1/4) 机器和 InternLM-Chat -7B 模型部署一个智能对话 Demo 环境准备 在 InternStudio 平台中选择 A100(1/4) 的配置,如下图所示镜像选择 Cuda11.7-conda,如下图所示: 接下来打开刚刚租用服务器的进入开发机 messages.append((input_text, response)) print(f"robot >>> {response}") 然后在终端运行以下命令,即可体验 InternLM-Chat-7B 模型对话能力 对话效果如下所示: python /root/code/InternLM/cli_demo.py web demo 运行 我们切换到 VScode 中,运行 /root/code/InternLM 目录下的 ,如下图所示: 在加载完模型之后,就可以与 InternLM-Chat-7B 进行对话了,如下图所示: Lagent 智能体工具调用 Demo 我们将使用 InternStudio 中的 A100

    51010编辑于 2024-02-28
  • 来自专栏我的机器学习之路

    PyTorch模型转TVM模型流程记录

    在这篇文章中,将介绍如何把一个EAST文本检测的PyTorch模型经ONNX转化为TVM模型的过程。 我们可以从Github上随便找一个带预训练参数的模型。这里我找来了一个以前在工作中用到过的EAST文本检测模型。 一方面是因为我们没用tvm中的runtime模块运行模型,另一方面是因为我们没有对tvm模型进行优化。 接下来我们将尝试使用autotvm对模型进行优化,看看优化之后的模型速度能否达到pytorch的同等水平。 4. 至此PyTorch到TVM模型的转换工作就全部完成了。 下一步将尝试将模型部署起来。

    2.8K30发布于 2020-10-23
  • 大语言模型为何难以模仿人类对话

    测试了多种模型研究人员测试的大语言模型包括ChatGPT-4、Claude Sonnet 3.5、Vicuna和Wayfarer。首先,他们独立比较了人类之间的电话对话记录与大语言模型模拟的对话。 然后,他们检查其他人是否能区分人类的电话对话和语言模型对话。在大多数情况下,人们不会被欺骗——至少目前还没有。那么,这些语言模型哪里做得不对呢?过度模仿当人们相互交谈时,会有一定程度的模仿。 此外,它们还可以用来组织对话。大语言模型在使用这些词方面仍然很糟糕。"大语言模型以不同的方式使用这些小词,而且经常不正确,"比埃蒂说。这有助于暴露它们的非人类身份。但还有更多问题。 这种介绍,以及向对话新阶段的转换,大语言模型也难以模仿,"比埃蒂说。对话的结尾也是如此。我们通常不会在信息传达给对方后就突然结束对话。 大语言模型的改进很可能能够缩小人类对话与人工对话之间的差距,但关键的差异可能会持续存在,"比埃蒂总结道。就目前而言,大语言模型仍然不够像人类,无法欺骗我们。至少不是每次都能成功。

    22210编辑于 2025-12-24
  • 本地部署小模型,支持中英文对话

    根据您对本地部署小模型支持中英文阅读和对话的需求,以下是一些主流选择,按模型类型和特点分类:一、通用对话型小模型(适合综合对话、问答)1.Llama-3.2-3B特点:3B参数,支持中文、英文等十几种语言 ,内存占用仅1GBQwen1.5-0.5B:5亿参数,支持多语言输入,适合情感分析和对话部署方式:Ollama或直接使用transformers库,纯CPU可运行3.granite-4.0-h-350m 、API集成二、专业翻译型模型(侧重中英文互译)5.腾讯HY-MT1.5系列HY-MT1.5-1.8B:18亿参数,支持33种语言互译,量化后仅1GB内存HY-MT1.5-7B:70亿参数,完整版翻译模型特点 ,支持中文、英文和工具调用部署方式:开源可商用,适合智能体开发部署建议模型类型推荐模型参数规模部署难度硬件要求入门级对话Qwen2.5-0.5B5亿⭐☆☆☆☆4GB内存+CPU平衡型对话Llama-3.2 这些模型都支持本地部署,保护数据隐私,且大部分可以在普通消费级硬件上运行。

    24610编辑于 2026-04-29
领券