首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏智能相对论

    汽车AI语音交互 正在让机器交互更接近真人交互

    斑马智行VENUS的AI语音得益于阿里达摩院的重磅加持以及科大讯飞、思必驰等合作伙伴的大力支持,极大提升了语音能力。 录音是内容AI模仿美国总统特朗普的话语。在此之前,Google旗下的DeepMind曾经公布了一个用AI合成人声的研究成果:WaveNet,达到以假乱真的地步。 声音是车载AI语音交互功能的“灵魂”,基于“声音克隆”技术,斑马智行VENUS系统将为用户提供“千人千声”的定制化服务,用户可以“克隆”亲人和爱人的声音,让陪伴更长久,让驾驶更舒心。 斑马网络AI语音相关负责人表示,斑马智行VENUS系统能在录制“倾听”中“掌握”每个人说话时的字母、音位、单词和语句的发音特点,通过深度学习技术推理并模仿声音中的语音音色、语调,“说”出全新的语句。 斑马智行的系统底层——AliOS,在传统触控、按键交互模式的基础上,将语音交互能力、视觉交互能力以及场景信息在系统层进行融合互通,更大程度得发挥了各个交互能力的优势,使得多模态融合理解、融合交互以及更自然的全双工对话

    1.7K10发布于 2020-05-11
  • 实时交互AI模型架构革新

    由前某机构首席技术官Mira Murati创立的人工智能研究初创公司Thinking Machines Lab Inc.希望超越“回合制”AI交互时代。该公司刚刚宣布了其首个“交互模型”的研究预览。 这是一类新型多模态AI系统,旨在避免人类与AI系统交互中不可避免的停顿。 任何经常使用AI的人都知道,基本的交互体验充其量是不连贯的:用户提供输入(如文本或上传图像),然后根据所用模型等待几毫秒到几分钟不等,才能最终收到输出。 经过数月使用,人类学会了像写邮件一样组织问题并批量处理想法,因为他们知道所使用的AI无法处理打断,也无法应对真正自然的人类交互中那些微妙的“反馈信号”(如“嗯”、“我明白了”)。 某机构分析师表示,看到Thinking Machines试图解决困扰企业AI用户已久的挑战令人鼓舞,因为确实需要让AI交互更加“人性化”。但他同时表示,该公司并非唯一致力于解决此问题的机构。

    9000编辑于 2026-05-23
  • 来自专栏chatgpt小智AI

    ChatGPT交互的智能助手|小智ai

    ChatGPT丨小智ai丨chatgpt丨人工智能丨OpenAI丨聊天机器人丨AI语音助手丨GPT-3.5丨开源AI平台在当今数字时代,人机交互已经成为我们生活中不可或缺的一部分。 与语音识别、计算机视觉等技术的融合也将使ChatGPT能够实现更多样化的交互方式,进一步提升用户体验。然而,随着聊天机器人的普及和应用范围的扩大,也带来了一些伦理和社会问题。 总体而言,ChatGPT代表了人机交互领域的一次重要进步。它通过自然语言处理和深度学习技术为我们提供了一个智能、便捷且个性化的交流工具。

    1.2K10编辑于 2023-05-12
  • 来自专栏个人总结系列

    AI编程Augment生成与DeepSeek交互对话

    1、安装AI编程Agument插件 需要购买Agument账号,插件安装到IDEA后可以选择Agent或者Chat模式交互,当前默认使用大模型是Claude Sonnet 4。 2、 创建Spring AI聊天交互项目2.1 配置2.1.1 maven依赖<dependency> <groupId>org.springframework.boot</groupId> artifactId>spring-boot-starter-web</artifactId></dependency><dependency> <groupId>org.springframework.ai </groupId> <artifactId>spring-ai-starter-model-deepseek</artifactId></dependency>2.1.2 DeepSeek配置server : port: 10001spring: application: name: spring-ai-deepseek-chat-model ai: deepseek: api-key

    71110编辑于 2025-08-26
  • 来自专栏云探索

    解锁高效 AI 交互:怎样撰写让 AI “秒懂” 的指令

    引言随着人工智能的飞速发展,AI对话系统已经逐渐融入我们的日常生活。无论是智能助手、在线客服还是内容创作,AI对话都在为我们提供便捷、高效的服务体验。 然而,要想让AI准确理解我们的需求并提供满意的答复,撰写一条合格的指令至关重要。本文将深入探讨如何在AI对话中撰写一条合格的指令,帮助你更好地与AI沟通,获取所需的信息和服务。 三、指令的优化与迭代在实际应用中,我们可能需要对初始指令进行优化和迭代,以进一步提升与AI交互效率和质量。1. 基于多次交互的迭代在与AI进行多次交互后,我们可以根据每次交互的结果对指令进行迭代优化。通过不断尝试和调整,我们逐渐找到最符合需求的指令表达方式。示例:• 第一次指令:“请用简单的语言解释量子力学。” 优化后AI响应:“以下是华为Mate 40 Pro手机的详细信息:(略)”通过上述案例分析,我们可以看到,初始指令由于缺乏具体性和明确性导致AI无法给出准确响应,而优化后的指令则引导AI给出了详尽的答复

    1.2K11编辑于 2025-03-16
  • 来自专栏AI

    我“AI”发文——AI与人机交互的发展趋势

    我“AI”发文——AI与人机交互的发展趋势 人工智能(AI)正在深刻改变人机交互(HCI,Human-Computer Interaction)的方式。 从传统的键盘输入到自然语言处理、语音交互、情感计算,甚至脑机接口,AI赋能的人机交互正变得更加智能、自然和高效。本文将探讨AI如何改变人机交互的方式,并展望未来的发展趋势。 1. AI驱动的人机交互方式 2.1 语音交互 AI的自然语言处理(NLP)技术使语音交互成为可能。 未来发展趋势 3.1 跨模态人机交互 未来的AI人机交互将不仅局限于单一模态,而是融合语音、图像、触觉等多种交互方式。 3.4 隐私与安全问题 随着AI人机交互的发展,用户数据的隐私保护变得越来越重要。未来,AI交互系统需要更强的数据安全策略,例如端到端加密、隐私计算等,防止用户数据泄露。 4.

    1K00编辑于 2025-03-29
  • LocalAPI.AI Desktop:本地AI交互新体验,全面升级!

    LocalAPI.AI Desktop 最新版本(v0.3.0)已经发布!这是一款在浏览器运行的AI客户端工具,为开发者和爱好者提供了一个便捷的交互平台。无论是本地操作还是远程接入,它都能轻松搞定。 远程接入,无缝连接 除了本地功能,现在还支持远程服务接入,包括国内的 Deepseek、kimi,以及国外的 x.ai、OpenAI、OpenRouter、GitHub 等平台。 为什么选择 LocalAPI.AI Desktop? 高性能:基于现代 Web 技术,响应速度快,体验流畅。 安全可靠:支持 API 代理,连接远程服务时提供中间认证,确保安全。 在线体验 访问 LocalAPI.ai 在线体验 最新版本信息 最新版本:LocalAPI.AI-Desktop V0.3-beta 下载与安装 更多版本请访问 GitHub Releases 页面。

    37810编辑于 2025-05-29
  • 来自专栏腾讯高校合作

    Wiztalk | 王历伟 Part 1 《多模态交互AI的发展和未来前景—多模态交互AI及例子》

    多模态交互AI的发展和未来前景 Part 1 多模态交互AI及例子 简介:多模态交互的人工智能,它其实在我们的学习生活中是无处不在的。

    80610发布于 2021-03-15
  • 智能地图:从基础展示到AI交互进化

    从基础地图展示到智能交互体验的进化之旅 目录项目背景与挑战技术架构设计地图基础能力构建AI赋能地图智能交互关键技术创新实现性能优化与用户体验成果展示与未来展望总结与收获项目背景与挑战在数字时代,地图服务早已超越了导航工具的范畴 优化地图性能懒加载策略:标记点分批加载路线计算缓存渲染优化:使用 cluster 聚合标记点动态调整缩放级别显示密度内存管理:及时销毁不使用的地图实例合理控制标记点数量AI赋能地图智能交互1. 技术成果AI交互效率提升:自然语言理解准确率:92%响应速度:平均 < 1.5秒用户满意度:4.8/5.0性能指标:首次加载时间:2.3秒标记点渲染:1000+ 个无卡顿内存占用:优化30%创新功能:语音控制地图交互智能推荐系统多轮对话支持 创新价值场景创新:将AI技术深度融入传统地图功能打造了全新的智能交互体验建立了用户意图理解的智能范式技术创新:自研的长按检测机制智能标记点聚类算法多目标路线优化方案体验创新:语音交互的自然化推荐系统的个性化响应速度的实时性 通过AI技术的赋能,我们让地图从'工具'进化为'伙伴',从'展示'升级为'交互'。在这个过程中,技术不再是冰冷的代码,而是连接人与空间的温暖桥梁。"

    17410编辑于 2026-04-16
  • 交互AI研究奖项与奖学金公布

    某机构与约翰霍普金斯大学公布六名研究员和九个教师研究奖项作为JHU + 某机构交互AI倡议(AI2AI)的一部分,首批获奖者名单已公布。 2022年10月5日某机构与约翰霍普金斯大学(JHU)今日公布了首批博士生奖学金和教师研究奖项的获得者,这些奖项属于JHU + 某机构交互AI倡议(AI2AI)的一部分。 “我们对JHU教师和学生提交的高质量提案和博士生奖学金提名感到高兴,”Alexa AI副总裁Prem Natarajan表示。“毫无疑问,这一倡议将推动交互式和多模态AI领域的最新技术进展。” “我们很高兴我们的学生和教师有机会在某机构合作,在交互AI这一重要领域进行合作,”约翰霍普金斯大学怀廷工程学院研究副院长Larry Nagahara表示。 我的兴趣与AI2AI交互AI技术领域的重点紧密对齐,特别是在计算机视觉和多模态AI方面。”

    21510编辑于 2025-09-09
  • 来自专栏ATYUN订阅号

    Supp AI使用机器学习来识别补充交互

    为此,艾伦研究所本周推出了门户网站Supp AI,帮助使用维生素、矿物质、酶和激素等补充剂的消费者,识别出可能会与之产生不利影响的产品或药物。 Supp AI不仅可以显示所有可能与查询补充物交互的化学物质或药物,还可以根据相关元数据对证据句进行排序,并对源文件进行优先级排序。 在Supp AI部署之前,2950万条自动标注的句子被输入到BERT-DDI模型中(一种补充药物相互作用证据提取器),促使补充品和药物CUIs的策展列表被用来删除不相关的句子,并将相关的证据分组在一起, 研究人员表示,近期的目标是定期更新Supp AI,将新论文中提取的最新信息纳入语义学者资料库。 Supp AI网址:https://supp.ai end

    80330发布于 2019-09-25
  • 来自专栏老张的求知思考世界

    基于四大AI交互协议的AI测试平台架构

    AI领域目前也出现了类似的统一标准或者机制,来实现大模型、智能体等AI工具之间的协作通信。截至目前,AI交互协议共出现了三种代表性的范式,如下图所示,分别是FC、MCP、A2A。 上述三大AI交互协议中,Function Calling负责实现技术细节的点,MCP负责模型之间通信,A2A负责多个Agent之间的协作,基于这三大交易协议,我们基本可以构建一个完善的AI后端服务。 而AG-UI的出现,在我看来正好弥补了AI交互的协议栈的最后一块短板,可以让我们更好地构建AI应用,推动AI在工作场景中落地。 交互协议来构建全流程的测试平台,思路如下: Function Calling:实现具体功能,如根据业务和数据映射关系生成测试数据; MCP:负责模型和其他工具(Agent)之间的通信,比如底层模型采用 A2A:负责实现多个Agent之间的通信,比如用例生成Agent、数据生成Agent、测试脚本生成Agent之间相互协作; AG-UI:实现后台服务(从大模型到Agent再到具体功能点)和前台的交互

    49110编辑于 2025-06-08
  • 来自专栏腾讯云开发者社区头条

    毛华:智能交互AI助力下的新生态

    腾讯云语音云总经理-毛华,在云+未来峰会上做了主题为《智能交互AI助力下的新生态》的分享,以下内容整理自演讲。 企业微信截图_15278210741886.png 毛华:前面很多专家讲了腾讯云AI的能力,最后我想讲一下小微是什么,周杰讲了很多基于小微背后技术的搭建。 我们希望小微和AI助力各个行业的转型,希望让小微无所不在,在各个行业,无论是音箱行业,或者是耳机,或者手机,或者机器人,或者汽车,或者智能家居等等。 我想重点提的哈曼,这款产品非常棒,无论从声音上面还是从光学效果上面,和我们的小微语音交互方面,这款产品用了三个全屏的喇叭和一个低音炮,效果非常震撼,同时在整个交互过程当中,最上面有一串灯,可以知道实时状态怎么样 也就是当用户带着耳机出去跑步打开QQ音乐的时候,我们整体语音交互都可以在QQ音乐里面完成,或者可以关闭,在手机锁屏状态下面也可以通过耳机和QQ音乐交互,非常简单。

    4.9K1610发布于 2018-06-01
  • AI加持,让鸿蒙元宇宙交互自然度飙升》

    在科技的前沿领域,鸿蒙元宇宙与人工智能的融合正绽放出璀璨光芒,尤其是在提升用户与虚拟环境的交互自然度方面,展现出了巨大的潜力和魅力。 个性化自适应体验每个人在元宇宙中的偏好和习惯都不尽相同,人工智能可以根据用户的历史行为数据进行学习和分析,为每个用户量身定制个性化的交互体验。 对于新手用户,AI还可以提供逐步引导,帮助他们更快地熟悉和适应虚拟环境;而对于熟练用户,系统则可以提供更高效、便捷的交互方式,减少不必要的操作步骤。 例如,用户可以通过简单的描述或草图,让AI生成一个独一无二的虚拟建筑或艺术作品;AI还可以根据用户的兴趣和当前的情境,实时创作出与之相关的故事和剧情,让用户成为故事的主角。 虽然目前已经取得了一定的成果,但要实现更加自然、流畅的交互体验,仍面临着诸多挑战,如技术的进一步优化、数据隐私的保护等。

    23500编辑于 2025-01-09
  • 来自专栏智能体

    意图即应用:Agentic AI时代计算交互新范式

    交互层面看,它是意图驱动的下一代交互范式。彻底重构了人机交互逻辑,用户只需表达目标,无需关心操作步骤与界面细节,实现从「人适应软件」到「软件适应人」的转变。 一个能帮你自动分析合同条款的AI工具,是知识自动化。 OpenAI对外表示他将参与研发下一代可相互交互以代表用户完成任务的个人Agent。 GitHubCopilot、Cursor、Devin这些工具已经让"程序员表达意图、AI写代码"成为日常,你不再是在写代码,你在表达意图,让AI把意图翻译成可执行的程序。 Neuralink目前聚焦于帮助运动障碍患者,但技术方向的终态是让人类意图直接与计算系统交互,绕开所有物理输入界面。

    44110编辑于 2026-03-17
  • 来自专栏phodal

    AI 智能体交互语言 DevIns:构建上下文感知的 AI 驱动编程

    PS:其实原来是叫 DevIn,但是无奈 Devin AI 项目发布了 demo 视频,所以改名为 DevIns。 即用户通过指令文本来与智能体进行交互, 而智能体返回内容,并对编辑器或者 IDE 进行操作。 所以,我们开始思考,是否可以通过自然语言来与智能体进行交互? DevIns 是一个界于自然语言与指令文本之间的交互语言,其中自然语言用于描述软件开发任务,而指令文本用于与智能体和 IDE 进行交互。 简单来说,DevIns 是一个可交互、可编译、可执行的文本语言。

    50310编辑于 2024-03-25
  • 来自专栏量子位

    Sonos音响加持AI,联手若琪推中文语音交互

    对不起,一台AI时代的好音箱,纯音质的标准已经彻底过时了。 除了音质,版权get,语音交互也要get。 之前,不少智能音箱从语音交互、音乐版权开始向音质覆盖。 现在,以音质著称的“古典”音响们,也开始纷纷拿起AI交互工具。 今天登场的是Sonos——而且是联手Rokid,加持中文语音交互。 ? Rokid“AI遥控器” 当前将实现中文语音交互的Sonos音响,还不是直接内置Rokid系统,而是通过外界Rokid mini完成。 ? 之前量子位已经爆料过,Rokid已经在AI芯片方面落子,并且产品据说已经实现量产,以后AI芯片将会是Rokid语音交互能力“All in One”的代表。 但智能音箱狂飙突进以来,语音交互成为检验智能的核心标准,于是“制霸”不止于版权内容,语音交互也在成为标配。 AI时代的好音箱,将拥有新标准:交互好、内容全,音质佳。 新的大战,一触即发。

    1.4K40发布于 2018-07-24
  • 小智AI音箱:智能语音交互的未来之选

    小智AI音箱:智能语音交互的未来之选 在人工智能与物联网深度融合的时代,智能音箱已从简单的音频播放设备,演变为家庭智能中枢。 小智AI音箱作为新一代国产智能语音助手硬件代表,凭借其强大的技术底座、流畅的用户体验以及开放的开发生态,正逐步赢得市场青睐。 本文将从 核心技术架构、用户交互体验、开发者支持体系 三大维度全面解析小智AI音箱,并特别加入 代码示例与技术实现细节,帮助开发者深入理解其能力边界与集成方式。 1.2 多模态交互:语音 + 触控 + 视觉反馈 部分高端型号配备 2.8 英寸 LCD 屏幕,支持图形化交互。开发者可通过 小智 UI SDK 控制界面元素。 结语:不止是音箱,更是家庭AI伙伴 小智AI音箱通过 自研算法、多模态交互、隐私优先设计 与 开放开发者生态,构建了一个可持续进化的智能语音平台。无论是普通用户还是专业开发者,都能从中获得价值。

    76610编辑于 2025-12-23
  • 来自专栏IT大咖说

    AI时代Chatbots对话式交互系统的技术与挑战

    摘要 一直以来,人机交互方式都在发生着不断的变化,从命令行交互,GUI交互,GUI+交互,直到现在的对话交互(CUI)。之前传统交互都是人在适配机器,而CUI则实现了机器来适配人。 本次演讲将介绍常用的对话交互技术框架,并通过实践来分享chatbots系统平台的技术和挑战。 ? Chatbots简史 ? 三个火枪手:三个Bot框架 IR-Bot:智能检索机器人 ? 因为任务型的这套框架主要是做多人对话,所以多人对话的时候我们需要记住用户在前几轮说的话或者系统前几轮给的回答,对话状态追踪做的就是把用户和系统历史上的交互相关信息记录下来。 对话交互的价值:在哪儿/在那儿 对话交互目前还处于行业早期阶段,除了技术比较成熟,还有很多不成熟的方面,它的价值还有待验证。 现在的技术有限,需要界定合理的需求,降低合作方的相关需求。

    1.4K60发布于 2018-04-03
  • 来自专栏云+直播

    AI赋能产品:如何寻找语音交互的业务场景

    作者:廖欣欣 《游戏运营:高手进阶之路》作者 / IEG 用户平台部 智能AI高级产品经理 这是一个创业者的复盘,主要内容分为两个部分。 一个创业者成长的心路历程——心路日记(1) 笔者进入AI领域,从事NLP相关的工作,已经超过18个月的时间了。如果算上我们的真9-9-6强度,走过的弯路,做过的那些项目经验广度与深度,没法算。 刚切入AI行业,耳濡目染熟悉了语音交互的优势和特性,比如: 解放双手,懒人最爱; 使用门槛低,会普通话就能用; 交互自然,没有什么学习成本; 一句话就能搞定需求; 如果一句话不行,那就两句?三句? 实际上,我们能够做到更好的数据表现,即用户怎么说,AI都能理解,但是没有接口给我们调用,因为没有播放版权,用户根本不买账。 我们如何释放AI的能力去革新体验,尽量提升(新体验)的价值。同时用户(替换成本)是什么,如何降低?如何两头用力,最大化创造用户价值?

    1.7K83发布于 2020-10-16
领券