首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI聊天机器人违反心理咨询伦理

AI聊天机器人违反心理咨询伦理

原创
作者头像
用户11764306
发布2026-06-05 22:22:31
发布2026-06-05 22:22:31
10
举报

一项新研究揭示了严重伦理风险:即便被指示遵循既定心理治疗方法,AI聊天机器人系统也持续未能达到如某心理学会等组织设定的专业伦理标准。

来自某大学的研究人员与心理健康专业人士密切合作,识别出反复出现的问题行为模式。在测试中,聊天机器人对危机情况处理不当,给出的回应强化了关于用户或他人的有害信念,并使用了一种制造同理心表象但缺乏真正理解的语言。

“在这项工作中,我们提出了一个包含15种伦理风险的实践者知情框架,通过将模型行为映射到具体的伦理违规,展示了大语言模型咨询师如何在心理健康实践中违反伦理标准,”研究人员写道。“我们呼吁未来的工作为大语言模型咨询师制定伦理、教育和法律标准——这些标准应反映出人工辅助心理治疗所需的质量和严谨性。”

提示如何塑造AI治疗回应

一位主导该研究的计算机科学博士生着手检验精心措辞的提示是否能引导AI系统在心理健康环境中表现得更符合伦理。提示是用于引导模型行为以完成特定任务的书面指令。

“例如,用户可能会向模型提示:‘扮演一位认知行为治疗师,帮助我重构我的想法,’或者‘运用辩证行为治疗的原则,帮助我理解和管理我的情绪。’虽然这些模型并不会像人类那样真正执行这些治疗技术,而是利用其学习到的模式,根据提供的输入提示生成与认知行为治疗或辩证行为治疗概念相符的回应。”

人们经常在各大社交平台上分享这些提示策略。除了个人实验,许多面向消费者的心理健康聊天机器人正是通过将治疗相关提示应用于通用大语言模型而构建的。这使得理解仅靠提示是否能使AI咨询变得更安全变得尤为重要。

在模拟咨询中测试AI聊天机器人

为了评估这些系统,研究人员观察了七名具有认知行为治疗经验的受训同伴咨询师。这些咨询师使用被提示扮演认知行为治疗师角色的AI模型进行了自我咨询。测试的模型包括某机构的GPT系列、某机构的Claude以及某机构的Llama等多个版本。

研究团队随后基于真实的人类咨询对话选择了模拟聊天记录。三名持牌临床心理学家审查了这些对话记录,标记可能的伦理违规行为。

分析揭示了15种不同的风险,分为五大类:

  • 缺乏情境适应能力:忽视个人的独特背景,提供通用建议。
  • 治疗协作不佳:过于强势地引导对话,有时会强化错误或有害的信念。
  • 欺骗性同理心:使用诸如“我理解你”或“我明白”之类的短语来暗示情感连接,而无真正的理解。
  • 不公平的歧视:表现出与性别、文化或宗教相关的偏见。
  • 缺乏安全与危机管理能力:拒绝处理敏感问题,未能引导用户寻求适当帮助,或对包括自杀念头在内的危机做出不充分的回应。

AI心理健康中的责任缺口

一位研究者指出,人类治疗师也会犯错。关键区别在于监督。

“对于人类治疗师,有管理机构和对提供者进行专业问责的机制,以应对不当治疗和医疗事故。但是当大语言模型咨询师做出这些违规行为时,没有既定的监管框架。”

研究人员强调,他们的发现并不意味着AI在心理健康护理中没有一席之地。人工智能驱动的工具可以帮助扩大服务可及性,特别是对于那些面临高昂费用或持牌专业人员有限的人群。然而,该研究凸显了在此类高风险情境中依赖这些系统之前,需要明确的安全保障、负责任的部署以及更强有力的监管结构。

严格评估为何重要

一位未参与该研究的某大学计算机科学教授表示,这项研究强调了仔细审查用于心理健康等敏感领域的人工智能系统的重要性。

“当今AI的现实是,构建和部署系统远比评估和理解它们容易得多,”这位教授说。“这篇论文需要一支临床专家团队和一项持续一年多的研究来证明这些风险。当今大多数AI工作都是使用自动化指标进行评估的,而这些指标在设计上是静态的且缺乏人工参与。”

她补充说,这项研究可以作为未来旨在提高AI心理健康工具安全性的研究的范本。

“人工智能确实有机会在应对我们社会面临的心理健康危机中发挥作用,但至关重要的是,我们要花时间在每一步真正批判和评估我们的系统,以避免弊大于利,”她说。“这项工作为这种评估可能的样子提供了一个很好的例子。”FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档